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Prólogo 


Este libro debe su origen a la necesidad de ofrecer al estudiante un primer 
contacto con las Matemáticas después de su etapa en la Enseñanza Media. Su 
objetivo fundamental es proporcionar al lector la base matemática necesaria 
con la que afrontar el estudio de otras disciplinas. En la práctica totalidad 
de las materias que conforman los planes de estudio de los actuales grados 
en ingeniería y ciencias, es ineludible que el estudiante maneje con soltura 
los objetos matemáticos que integran su contenido. Por ello su conocimiento 
constituye una herramienta indispensable. Además el ejercicio del método 
matemático mediante los procesos de demostración contribuye a desarrollar 
la capacidad de discusión lógica. 


Temas de Matemáticas está pensado para cursar en un semestre. Consta 
de tres bloques temáticos: Algebra lineal, Análisis de funciones reales de 
una y varias variables reales y una introducción al Cálculo numérico. Sus 
cimientos son las matemáticas estudiadas en el Bachillerato, a partir de las 
cuales se construye toda la estructura del libro. Se profundiza en los conceptos 
y propiedades allí aprendidos y con esa base se establecen otros nuevos. 


El libro comienza con el estudio de los números reales, no sólo porque 
es el dominio en el que se realiza toda su exposición, sino también porque 
a través de la axiomática que lo define, es muy convenieniente que el lector 
distinga desde el principio su diferencia con los otros sistemas de números: 
naturales, enteros, racionales y complejos. De esta manera se obviará la posi- 
ble dificultad que pueda surgir en diferentes situaciones. En la introducción 
de este primer capítulo se recuerda el concepto de operación y las principales 
estructuras algebraicas. * 


El segundo capítulo está dedicado a matrices y determinantes. Estos 
temas ya son conocidos por el estudiante. Su inclusión la hemos considerado 


TI 


necesaria para facilitar el estudio de las aplicaciones lineales, núcleo central 
de los temas de Algebra lineal. 


Un primer objetivo del bloque de Álgebra lineal es unificar el estudio y 
reinterpretar los resultados que surgen en muchos casos particulares tratándo- 
los de forma general. Esto supone una visión mucho más global y una notable 
economía de esfuerzo. Por ejemplo, las matrices, los polinomios, las sucesiones 
de números reales, etc. son espacios vectoriales y podemos establecer las 
propiedades de sus operaciones de una vez por todas. Además, su aplicación 
al análisis de funciones, alguna de las cuales veremos en el propio texto, y a la 
práctica totalidad de las otras asignaturas, hacen imprescindible su estudio. 


En los capítulos 3 y 4 se expone la teoría de espacios vectoriales. El 
primero contiene los conceptos y propiedades generales de espacios y sub- 
espacios y el segundo el estudio de sus aplicaciones lineales, centrándose en 
el caso de los espacios de dimensión finita. El capítulo siguiente se dedica a 
las aplicaciones bilineales y formas cuadráticas. La limitación de espacio ha 
impedido tratar algunos temas de gran interés como la teoría de dualidad o 
el estudio de cónicas y cuádricas. 


En el bloque de Análisis de funciones, los dos primeros capítulos se ocupan 
del cálculo diferencial y el cálculo integral de las funciones de una variable. En 
ellos se prueba, profundiza y completa conceptos y propiedades ya conocidos 
por el lector. En los dos siguientes capítulos se tratan los temas análogos para 
funciones de varias variables. Hemos pretendido que la generalización se haga 
de la manera más natural posible, poniendo de manifiesto las diferencias 
y similitudes existentes entre ambos casos. La definición y propiedades de 
la integral de Riemann se extiende en un primer paso a funciones de dos 
variables. De esta manera consideramos que su extensión a la integral triple, 
y en general a la integral de funciones de cualquier número de variables, no 
ofrece ninguna clase de dificultad. 


El capítulo 5 comienza con el estudio de las sucesiones de números reales. 
La mayor parte de las reglas de cálculo de los límites, continuidad, derivación 
e integración de funciones se prueban de forma análoga a las propiedades del 
cálculo de límites de sucesiones de números reales. Por ello es muy impor- 
tante conocer bien las demostraciones de estas últimas, lo que convertirá las 
primeras se en un mero ejercicio. 
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El Análisis numérico es una de las grandes ramas de las Matemáticas. El 
último capítulo pretende ser únicamente una breve introducción a la materia 
y mostrar algunos ejemplos de problemas. El lector interesado encontrará en 
la bibliografía del final algunas obras que le ayudarán a completar el tema. 


Cada capítulo esta dividido en secciones y estas a su vez en subsecciones. 
Comienza con una introducción que recuerda conceptos necesarios para su 
estudio, contiene algún comentario histórico y termina con los principales 
objetivos que se deben alcanzar. Se incluyen una buen número de ejemplos 
de todas las cuestiones tratadas y al final de los capítulos se propone un 
conjunto de ejercicios y cuestiones, análogas a los ejemplos, cuya resolución 
permitirá al lector su autoevaluación. Hemos procurado que la notación sea 
lo más sencilla posible. 


Otra pretensión ha sido el intento de aproximar la redacción del texto a 
la exposición en clase. Esto conlleva en ocasiones la conveniente repetición 
de cuestiones ya tratadas con anterioridad. Además, para proporcionarles un 
mayor énfasis a los resultados, hemos dado nombre a la mayoría de proposi- 
ciones y teoremas. En cada capítulo hemos enumerado los ejemplos debido a 
las obligadas referencias. Algunas demostraciones se salen fuera del alcance 
del libro y se remite al lector a la bibliografía del final, aunque pueden en- 
contrase en numerosos textos de caracter más avanzado. 


Finalmente, deseo expresar mi agradecimiento a los profesores Miguel 
Sama y María Dolores Galera por su valiosa contribución con la revisión del 
texto y las sugerencias hechas, a la profesora Esther Gil por su ayuda en la 
realización de las figuras y a la editorial Sanz y Torres por el trato recibido 
y el cuidado puesto en la edicción del libro. 
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Capítulo 1 
Los Números reales 


1. Introducción y objetivos. 


En este capítulo vamos a estudiar los sistemas de números. Una buena 
parte de las definiciones, propiedades y objetos matemáticos que aparecen 
ya son conocidos por el lector. Por ejemplo, los números racionales, los poli- 
nomios, los vectores del plano, las aplicaciones y sus propiedades, etc. ya han 
sido tratados en etapas anteriores. 


En la presente sección vamos a recordar y precisar algunas cuestiones 
que nos permitan una mejor comprensión del tema, así como enunciar los 
objetivos más importantes que nos proponemos alcanzar con su estudio. 


1.1. Los números. 


Desde el principio los seres humanos tuvieron la necesidad de contar las 
cosas, es decir, de contar los elementos que constituían un determinado con- 
junto. Emplearon para ello los números naturales 


N=0,1,2,3,..M.., 


entre los que en principio incluímos el cero por ser el número de elementos 
que contiene el conjunto vacío, es decir, el conjunto que no posee ningún 
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elemento. Sin embargo, consideraremos que 0 no pertenece a los números 
naturales si tratamos cuestiones de orden (números ordinales). Por ejemplo 
en las sucesiones, ya que el primer término lo asociamos a 1, el segundo a 2, 
el tercero a 3, etc. Tampoco lo incluiremos en el caso en que n sea la variable 
de una expresión aritmética para la que n = 0 no tenga sentido. 


Al número n de elementos de un conjunto M le llamamos cardinal de M. 
Aparece así de forma muy clara e intuitiva la noción de suma n + m de dos 
números naturales como cardinal de la unión de dos conjuntos. Consecuencia 
de ello es la noción de producto nxm como suma n veces de m consigo mismo. 


El hombre comenzó a deber y atribuyó el signo menos al número de 
elementos que adeudaba. La unión de esta clase de números negativos y los 
números naturales constituyen los números enteros 


L=....,—N,..., =3,-2,-1,0,1,2,3,...,N,..., 


cuya existencia permite resolver la ecuación z + a = b, cualesquiera que 


sean a y b pertenecientes a Z. Se definían también en Z las operaciones suma 
y producto como extensión de las de N (el producto mediante la conocida 
regla de los signos). Asimismo se introducía en Z el concepto de divisibidad 
o cociente exacto de dos números y se generalizaba el orden de N. 


El tamaño de algunos objetos, suceptibles de poder ser divididos en partes 
iguales, creó de nuevo la necesidad de ampliar la clase de los números. Apare- 
cen así los números racionales Q, término que procede de ración o parte 
v no de razonamiento o pensamiento racional. Un número racional es el co- 
ciente p/q de dos números enteros con denominador q distinto de cero, es 

1 

: des y r : ; p p 

decir, una fracción ordinaria. Como todas las fracciones equivalentes (= = s 

q 
si y solo si pq’ = p'q) representan al mismo número racional, se considera co- 
mo representante canónico del número a la fracción irreducible (aquella 
en que p y q no tienen divisores comunes). 


Es claro que el conjunto Z es un subconjunto de los números racionales 
E 
o=(; pa EZ:9 40) 


va que cualquier p € Z se puede escribir en la forma a Además las opera- 
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ciones suma y producto, así como el orden, se extienden de manera natural 
de Z a Q. 


Desde el punto de vista matemático la existencia de Q permite resolver 
la ecuación qx = p, con p,q € Z y q Æ 0, cuya solución en Z solo sería posible 
si p fuese divisible por q. Además Q es un conjunto ordenado que cumple la 
propiedad arquimediana o de densidad : para cualquier par de números 
racionales existe otro número racional situado entre ellos (basta considerar 
su semisuma), propiedad que no cumple Z. 


En el siglo V a de C. los matemáticos griegos se dieron cuenta de la exis- 
tencia de cantidades no conmesurables, es decir, de la existencia de números 
que no eran racionales. En efecto, si fijamos un segmento cualquiera cuya 
longitud consideramos uno, y aplicamos el Teorema de Pitágoras, la longitud 
de la diagonal del cuadrado de lado uno es v2 que no es un número racional, 


E j Eo E Ue : 
va que si lo fuera podría escribirse como una fracción = irreducible (tal que 
q 


p y q no tienen divisores comunes), entonces 


2 
C 


con lo que p? sería un número par y como consecuencia p también sería 


par. Entonces podríamos ponerlo de la forma p = 2m, en donde m € N. 
Sustituyendo en la expresión anterior obtenemos 


w e 4 => 20 


4 a P PE- 3 
con lo cual, a su vez, q también sería par. Por tanto — no sería irreducible ya 
q 
que p y q tendrían como divisor común a 2. 


Los griegos designaron a estos números con el nombre de irracionales. 
Siguiendo un razonamiento análogo al anterior es muy sencillo probar que 
números como v3, V17 o Y/5 son números irracionales. Además, el lector ya 
conoce otros números irracionales como m (relación entre la longitud de una 
circunferencia y su diámetro) o el número e (base del logaritmo neperiano). 
Los conjuntos de números racionales e irracionales constituyen los números 
reales R. 


Una representación geométrica del conjunto de los números reales es la 
recta real. Fijado el segmento unidad y un punto de la recta que denomi- 
namos origen y representa a cero, situamos los números positivos a la derecha 
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de cero y los negativos a la izquierda (Figura 1). De este modo tenemos una 
correspondencia biunívoca (uno a uno) entre los números reales y los puntos 
de la recta. 





Figura 1: Recta real. 


A mediados del siglo XVI, al intentar resolver algunos problemas me- 
diante ecuaciones algebraicas, se obtenían soluciones imposibles; esto mo- 
tivó la necesidad de extender los números reales a una clase más amplia: 
los números complejos. Sirva como ejemplo el problema propuesto por 
Cardano en 1545: 


“Dado un segmento de longitud 10, ¿se puede dividir en dos segmentos 
de modo que sea 40 el área del rectángulo cuyos lados sean estos segmentos” 


Si z es la longitud de uno de los segmentos y 10 — x es la longitud del 
otro, entonces el área viene dada por x(10 — x); pero al resolver la ecuación 
z(10 — x) = 40, la solución es z = 5 + y—15 y esta solución es imposible o 
imaginaria. 


En resumen, al resolver ecuaciones tan sencillas como 1?+1 = 0, aparecen 
raíces cuadradas de números negativos, x = y—1, y la manera de que esta 
clase de ecuaciones tuvieran solución era extender los números reales. Se 
introdujo la notación y/—1 = i (unidad imaginaria) y se consideró el conjunto 
de los números complejos l 

, 


C=(fa+bi:a,be R} 


al que se extendieron las operaciones definidas en R, teniendo en cuenta que 
i? = —1. Nótese que en caso de que la parte imaginaria sea cero, b = 0, se 
obtiene un número real y en caso de que la parte real sea cero, a = 0, se 


obtiene un número imaginario puro. 


Tenemos así el siguiente esquema de los números 
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Naturales 
Racionales Enteros negativos 
A Reales s ; 
Complejos Fraccionarios 
Irracionales 
Imaginarios puros 


Enteros i 


Supondremos que el lector está familiarizado con el sistema de números 
racionales y conoce las propiedades de sus operaciones y la relación de orden 
existente entre sus elementos. 


1.2. Operaciones y estructuras. 


El lector, sin duda alguna, está acostumbrado a realizar operaciones con 
distintos objetos matemáticos: números, polinomios, funciones, vectores,...etc, 
operaciones para las que ha estudiado diferentes propiedades. Vamos a recor- 
dar aquí, prescindiendo de la naturaleza de los elementos que forman el con- 
junto, los conceptos de operación y sus propiedades. Esto nos permitirá recor- 
dar algunas estructuras algebraicas necesarias para una mejor comprensión 
del texto. 


La palabra álgebra viene de la palabra árabe al-Jabr que significa reduc- 
ción. El objetivo que tiene el Álgebra es la generalización de las fórmulas 
más allá de:las situaciones o problemas particulares (aunque puedan tener 
un cierto caracter general). Esto se consigue por medio de las estructuras 
algebraicas. Una estructura algebraica es un conjunto (no vacío) en el que 
están definidas una o más operaciones que poseen determinadas propiedades. 


Una operación o ley de composición interna o en un conjunto 
cualquiera M, es una aplicacion de M x M en M, es decir, es una relación 
que a cada par de elementos a,b de M le hace corresponder un elemento de 
M que designamos por aob. La operación puede tener diferentes propiedades: 


1. o es conmutativa si aob=boa para todo a,b € M. 


2. o es asociativa si (aob)oc=ao0(boc) para todo a,b,c € M. 
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3. o posee elemento neutro e si ace=eo0a=a para todo a € M. 


4. Si o posee elemento neutro e, se dice que a € M es el elemento 
inverso de a si aca =d oa =e. 


Nótese que si a’ es el inverso de a, entonces a es el inverso de a’. En caso de 
que sea la suma la operación interna, el elemento inverso se suele denominar 
simétrico. Por otro lado, si en M están definidas dos operaciones internas 
o y T, la propiedad siguiente las relaciona. 


5. 7 es distributiva respecto a o si aT (boc) = (a Tb) © (aT c) para todo 
a,b,c € M. 


Para definir las estructuras algebraicas más usuales, que son las únicas 
con leyes internas a las que haremos referencia en este libro, y por analogía 
con las operaciones de los números, designamos las operaciones internas del 
conjunto M por suma + y producto x, así como sus respectivos elementos 
neutros por 0 y 1. Entonces: 


A) (M, +) es un grupo si + es asociativa, posee elemento neu- 
tro y cada elemento posee inverso. Si además + es conmutativa, entonces 
el grupo se dice que es conmutativo o abeliano. 


B) (M, +, X) es un anillo si (M, +) es un grupo conmutativo 
y X es asociativa y distributiva respecto a +. Si además la operación x 
es conmutativa, entonces el anillo se dice que es conmutativo; y si x tiene 
elemento neutro, entonces se dice que el anillo es unitario. 


C) (M,+,x) es un cuerpo si (M, +, X) es un anillo conmuta- 
tivo unitario, y (M — {0}, X) es un grupo. 


1.1. Ejemplos. 


a) El conjunto F de las funciones de f : R —>R con la suma (f +g)(£) = 
f(£)+ g(x) y el producto (f x g)(x) = f(x) x g(x) es un anillo conmutativo. 
Obsérvese que los elementos neutros de la suma y el producto son respecti- 
vamente las funciones constantes k(x) = 0 y h(x) = 1, que el inverso de f es 
—f y que (F, +, X), cumple el resto de las propiedades requeridas. 


b) Si consideramos en el conjunto de las funciones polinómicas P(x) con 
la suma y el producto definidos igual que en F, resulta que (P(x), +, x) es 
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también un anillo unitario, (nótese que la suma y el producto de dos poli- 
nomios es un polinomio), ya que cumple también todas las propiedades. Como 
P(x) es un subconjunto de F decimos que (P(x), +, x) es un subanillo de 
(F,+,x). 


f ; l À 
c) Consideremos ahora el subconjunto P*(x) formado por todos los poli- 
nomios que toman en x = 0 el valor 0, es decir 


P*(x) = [p(x=) € P(z) : p(0) = 0) 


(P*(x),+,x).es un subanillo de (P(x),+,x) y por tanto también es un 
subanillo de (F, +, x). 


d) El conjunto de los números racionales Q con la suma + y el producto 
x es un cuerpo. Nótese que el elemento neutro de + es 0, el elemento neutro 
de x es 1 y el elemento simétrico de p/q es —p/q, y el elemento inverso q/p. 


e) El conjunto de los números reales R con la suma + y el producto x 
también constituyen un cuerpo. Lo estudiaremos en el epígrafe siguiente. 


Nota. Si en un conjunto se tienen definidas la suma y el producto es ha- 
bitual denominar simétrico al elemento inverso de la suma para distinguirlo, 
en su caso, del elemento inverso del producto y evitar así tener que mencionar 
la operación correspondiente. 


Finalmente, es conveniente insistir en que el estudio de las estructuras 
algebraicas viene motivado al tratar de optimizar el esfuerzo, ya que mediante 
un proceso de abstracción se considera una situación totalmente general a 
la que obedecen muchas situaciones particulares que presentan conjuntos de 
objetos matemáticos concretos. 


1.3. El método de inducción. 


La inducción matemática es un método de demostración que se aplica 
para probar que una propiedad P(n), que depende del número natural n, 
se cumple para todos ellos, es decir se cumple cualquiera que sea el número 
natural n. El principio de inducción se basa en la propia definición axiomática 
de los números naturales dada por Peano: a cada número natural le sigue otro. 
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Los pasos para efectuar la demostración son los siguientes: 
1. Se comprueba que el 1 cumple la propiedad, esto es P(1) es cierta. 


2. Se supone que la propiedad es cierta para n (arbitrario) y se demuestra 
que es cierta para n + 1, esto es, se supone cierta P(n) y se prueba que 
P(n + 1) es cierta. 


La inducción no tiene necesariamente que empezar en 1, puede empezar 
en cualquier otro número natural ny, entonces se comprueba que P(ng) es 
cierta y se supone cierta para cualquier n > no demostrando que lo es para 
n+1. Naturalmente en este caso la propiedad no tiene porque cumplirse para 
los números menores que no. 


1.2. Ejemplo. 
Probemos que n? + 2n es múltiplo de 3, esto es 
P(n) = (n* + 2n es múltiplo de 3) 


es cierta para cualquier n. 
1. Para n = 1, resulta P(1) = 3, luego es cierta. 


2. Supongamos que P(n) = n? + 2n es cierta y probemos que 
P(n+ 1) = {(n + 1)? +2(n + 1) es multiplo de 3) 
es cierta. En efecto 
(n+1)} +2(n + 1) = (n? + 2n) + 3(n2 +n +1) 


Como por hipótesis (nê + 2n) es múltiplo de 3, el segundo miembro de la 


igualdad es la suma de dos mútiplos de 3 y por tanto múltiplo de 3. 


Finalmente, el principio de inducción también se puede utilizar para es- 
tablecer una definición o construcción. En el capítulo siguiente, establecere- 
mos la definición de determinate de una matriz de orden n a partir de la 
definición de los determinantes de las matrices de orden dos, tres y cuatro. 
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1.4. Objetivos. 


1. Conocer los sistemas de números naturales, enteros y racionales y sus 
propiedades y advertir las diferencias entre ellos. 


2. Probar la existencia de números irracionales. 
3. Conocer las estructura de grupo, anillo y cuerpo. 


4. Conocer los axiomas que determinan el cuerpo de números reales, con 
especial énfasis en el axioma del supremo (que no cumplen los otros sistemas 
de números). 


5. Manejar las representaciones geométricas y decimal de los números 
reales. 


6. Determinar en los conjuntos acotados, su supremo y su ínfimo. 
7. Encontrar los puntos de adherencia y de acumulación de un subcon- 
junto. 


2. Definición axiomática de los números reales. 


La definición de número real es uno de los conceptos más importantes 
de las Matemáticas. Sin embargo más que su construcción rigurosa, que el 
lector interesado puede encontrar en alguno de los libros de la bibliografía, 
nos interesan sus propiedades, razón por la cual consideraremos un conjun- 
to de axiomas de los cuales pueden deducirse todas ellas. Estos axiomas 
caracterizan a R en el sentido de que cualquier otro conjunto que los cumpla 
puede identificarse con él. 


En general todas las clases de números pueden construirse de forma lógica 
a partir de un conjunto fundamental de axiomas, es decir de propiedades que 
consideramos ciertas. En general, los axiomas son “verdades evidentes” que 
suelen extraerse del comportamiento real de los fenómenos, es decir de la 
experiencia. 
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2.1. Operaciones con números reales. 


El primer axioma es la existencia de las operaciones internas suma z + y 
y producto xy (si no hay posibilidad de confusión omitimos el signo x). 
Sean x,y,z tres números reales, además del axioma anterior, se satisfacen los 


siguientes: 
Axiomas de (R, +) grupo conmutativo. 
Al. 2+(y+2)=(2+Y1)+2 Ley asociativa de la suma 
A2. 0es elemento neutro de + Existencia de elemento neutro 
A3. Para todo x existe simétrico — x Existencia de elemento simétrico 
A4. I+y=y+2 Ley conmutativa de la suma 
Axiomas de (R — {0}, x) grupo conmutativo. 
A5. au) = (ene Ley asociativa del producto 
A6. les el elemento neutro dex Existencia de elemento neutro 
A7. Para todo x Æ 0 existe inverso 1/x Existencia de elemento inverso 
A8. tY =Y8 Ley conmutativa del producto 
Axioma de la propiedad distributiva 
A9. 2(Yy+2)=1y +22 Ley distributiva 


Los nueve axiomas anteriores son las propiedades que satisfacen la estruc- 
tura de cuerpo, por tanto (R, +, x) tiene estructura de cuerpo conmutativo. 
Observemos que los números racionales cumplen también todos los axiomas, 
es decir (Q, +, x) es un cuerpo, como ya habíamos adelantado. Los números 
enteros cumplen todos los axiomas menos A7 con lo que (Z, +, x) es un anillo 
conmutativo unitario. 
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2.2. El orden en los números reales 


Consideramos también una relación < que establece un orden en los 
números reales y convenimos que x < y significa lo mismo que y > g. Se 
tienen los siguientes axiomas: 


Axiomas de orden. 


A10. Se verifica una y solo una de las siguientes relaciones 
Di= YD: AD 
A11. Si x < y, para todo z se tiene z+2<yw+2z. 


A12. Six>0ey>0, entonces xy > 0. 
A13. Si x >y e y >z, entonces z> z. 


Como ya comentamos en la introducción, el orden de los números natu- 
rales se extiende a los números enteros y el de éste a los números racionales. 
Es claro que el orden en Z y Q cumple los cuatro axiomas anteriores y que 
de ellos se deducen todas las operaciones con desigualdades. Por ejemplo, si 
T < y, entonces zz < yz si z > 0 y xz > yz si z < 0, es decir el sentido de 
la desigualdad permanece si se multiplica por un número positivo y cambia 
si se multiplica por un número negativo. Se utiliza la notación x < y para 
expresar de forma abreviada que z < y o bien z = y. 


Sea M un subconjunto de números reales. Un número real b es una cota 
superior de M si para todo x € M se tiene que x < b; se dice que M 
está acotado superiormente si tiene una cota superior. De forma análoga 
a es una cota inferior de M si a < x para todo x € M; se dice que 
M está acotado inferiormente si tiene una cota inferior. Un conjunto es 
acotado si lo es superior e inferiormente. 


Definición de supremo e ínfimo. Sea M un subconjunto de números 
reales acotado superiormente. Se dice que b es el supremo o extremo superior 
de M sib es una cota superior de M y para cualquier otra cota superior b' 
se tiene b < b'. Al supremo de M se le denota por sup M. 


Análogamente, si M está acotado inferiormente, se dice que a es el ínfimo 
o extremo inferior de M si a es una cota inferior de M y para cualquier otra 
cota inferior a' se tiene a' < a. Al ínfimo de M se le denota por ínf M. 
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El último axioma del sistema de números reales involucra el concepto de 
supremo y se conoce con ese nombre. 


Axioma del supremo. 


A14. Si M es un conjunto no vacío de numeros reales acotados 
superiormente, entonces posee supremo. 


Los axiomas dados determinan el sistema de números reales en el sentido 
de que cualquier conjunto que los cumpla se puede identificar con él. Hemos 
comentado antes que los números racionales cumplen los trece primeros axio- 
mas, pero no cumplen el axioma del supremo. Por ejemplo el supremo del 
conjunto de números racionales menores que V2 es el propio v2 que no es 
racional. 


1.3. Ejemplos. 


a) El conjunto M = (1/n:n=1,2,3,....) está acotado superiormente 
por cualquier número mayor o igual que 1 e inferiormente por cualquier 
número menor o igual que 0. El supremo de M es 1, que pertenece a M, y el 
ínfimo es O que no pertenece a M. 


b) En el conjunto M = [-3<x<7:xERj] se tiene sup M = 7 e 
ínf M = —3. Ninguno de ellos pertenece a M. 


c) El conjunto M = {7 : xz? > 2} no está acotado superior ni inferiormente 
y por tanto no tiene supremo ni ínfimo. 


d) El conjunto M = [zx : 1 > 0,2? > 5) no está acotado superiormente, 
pero sí inferiormente e ínf M = V5 que no pertenece a M. 

e) En el conjunto M = [zx : 0 < x? < 1) se tiene sup M = 1 e ínf M = —1 
va que la desigualdad que lo define es equivalente a las desigualdades 0 < 
a<1ly-1<x<0. 


2.3. Representación decimal. 


Conocemos ya la representación geométrica de los números reales a través 
de la recta real, de modo que fijado el origen y el segmento unidad, a cada 
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punto le corresponde un número y a cada número un punto. Además, todo 
número real puede expresarse en forma decimal, es decir de la forma 


== A0, 01090304....... Ur... .... 


en donde ay es 0 o un entero positivo y an es uno de los dígitos de 0 a 9. Si 


prescindimos del signo para simplificar la escritura, lo que no resta ningún 
tipo de generalidad al comentario, entonces ap, 41090304....... a es una 
manera abreviada de escribir la suma de infinitos sumandos 


rasa io traia or arar A A 


Si el número es racional se cumple que, o bien todos los decimales son 
O a partir de uno, por ejemplo 3, 745000....,0....... (en la práctica escribimos 
simplemente 3,745), o bien hay una cifra o grupo de cifras que a partir de 
una se repite indefinidamente, por ejemplo —0, 237464646......,46......(en la 
práctica escribimos simplemente —0, 23746) , entonces decimos que el número 
es decimal periódico y a la cifra o cifras que se repiten se les llama periodo. 
El lector conoce de la arimética elemental como encontrar la fracción a partir 
de su expresión decimal. 


Si el número es irracional, los dígitos se suceden indefinidamente sin que 
exista ningún periodo, por ejemplo v2 = 1, 4142135..... . Obsérvese que cada 
número racional de la sucesión 


1; 1,4; 1,41; 1,41; 1,414;1, 4142; 1, 41421;.... 


va aproximando a v2 cada vez con menor error. 


3. Conceptos topológicos. 


La palabra topología significa estudio del lugar (topos lugar y logos es- 
tudio). Su objetivo es conocer la naturaleza de los conjuntos, es decir, sus 
propiedades, para lo cual se interesa de manera especial por el concepto de 
proximidad. En posteriores capítulos, al estudiar el espacio R”, establecere- 
mos su definición formal como una familia de subconjuntos que cumple unas 
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determinadas propiedades. A continuación examinamos la proximidad en la 
recta real por medio de la distancia entre dos puntos y los entornos de un 
punto. 


3.1 Distancia en la recta real. Entornos de un punto. 


El conjunto de puntos (números reales) x tales que a < x < b se llama 
intervalo abierto de extremos a, b y se representa por (a,b) o bien Ja, b|. El 
conjunto a < x < b intervalo cerrado y se denota por [a,b]. Los conjuntos 
a<x<byas<zx<bse llaman intervalos semiabiertos o semicerrados 
haciendo referencia a que uno de los extremos pertenece al conjunto y el 
otro no. Un punto a divide a la recta en dos semirrectas xr <a yzr>a 
que también se consideran intervalos y se representan por (—oo, a) y (a, 00) 
respectivamente; y en caso de ser z < a o x > a por (—oo, aj o la, 00). 


Definimos el valor absoluto de un número zx, y lo representamos por 
|z|, de la siguiente manera: 


es decir el valor absoluto |:| es una aplicación de los números reales en los 


números reales positivos R* unión con cero |-| : R > R* u {0}. 
Se cumplen las propiedades siguientes. 


1. |x| = 0 si y sólo si z = 0. 
2. |zyl = |æ| [yl . 
3. |æ + yl < lx] + ly]. 


Las dos primeras propiedades son claras, la demostración de la tercera se 
propone como ejercicio. A partir del valor absoluto definimos la distancia 


entre dos puntos zx, y de la recta real o lo que es equivalente la longitud del 
segmento que determinan. De las propiedades del valor absoluto se deducen 
de forma inmediata las siguientes propiedades de la distancia 
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1.d(A9)= 0 yeolo rias y: 


2 la) 
als) <del tdle) 


El conjunto de todos los puntos x tales que d(x, a) < ô, esto es |x — a] < ô, 
en donde ô > 0, se llama intervalo abierto de centro a y radio ô. De forma 
análoga el conjunto de todos los puntos x tales que d(x,a) < ô, esto es 
|z — a| < ô se llama intervalo cerrado de centro a y radio ô. En general se 
dice que un conjunto U es un entorno de a si contiene a un intervalo abierto 
de centro a. En el caso de que excluyamos de U el punto a, se dice que 
U — {a} es un entorno reducido de a. Los entornos expresan la proximidad 
al punto, con lo que para medir esta proximidad basta considerar siempre 
entornos que sean intervalos abiertos de centro el punto. 


3.2 Adherencia y acumulación de un conjunto. 


Dado un conjunto M de números reales, se llama punto límite o punto 
de acumulación de M a un punto a tal que para cualquiera que sea ô > 0, 
tan pequeño como queramos, existen puntos x de M tales que 0 < |z — a] < 
ô. En otras palabras cualquier entorno reducido del punto contiene puntos 
del conjunto, es decir (U — {a}) N M # Ø. El conjunto de los puntos de 
acumulación de M se denota por M”. 


Análogamente, se dice que un punto a es de adherencia de M si cualquier 
entorno de a contiene puntos de M, es decir U N M Æ (. El conjunto de los 
puntos de adherencia de M se denota por Adh M o bien por M. 


Como consecuencia de las definiciones, es evidente que tanto el con- 
junto como su acumulación están contenidos en su adherencia, es decir, 
M C Adh M y M’ C Adh M. Sin embargo la adherencia no tiene porque 
coincidir con la acumulación. Por ejemplo si M es la unión del intervalo 
(-1, 1) y el punto 3, esto es M = (—1, 1) U {3}, entonces M = |—1, 1] U {3}, 
mientras que M’ = |—1, 1]. Es claro que 3 £ M' pues el intervalo de centro 
a = 3 y radio ô = 1, si excluimos el punto 3, no contiene ningún punto de 
M. A esta clase de puntos a que poseen un entorno U cuya intersección con 
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el conjunto es únicamente el punto , U N M = {a}, se les llama puntos 
aislados. Por tanto Adh M es la unión de M’ y los puntos aislados de M. 
Si M no tiene puntos aislados, entonces Adh M = M”. 


1.3. Ejemplos. 


a) Los puntos de acumulación del intervalo (—2, 1] son todos los puntos 
del intervalo y el punto z = —2. 


b) El único punto de acumulación del conjunto M = {1/n : n = 1,2,3,....) 
es x = 0. Sin embargo Adh M = M U {0}. Nótese que todos los puntos de la 
sucesión son aislados. 


c) El conjunto de los puntos de acumulación de los números racionales 
es todo R porque todos los puntos irracionales son de acumulación de Q 
aunque no pertenecen a Q. Por ejemplo v2 es un punto límite de Q y no es 
un elemento de Q. Es claro que Adh Q = Q' = R. 


d) El conjunto de los puntos de acumulación de los intervalos [-1,1], 
(-1, 1), (21,1) y (—1, 1] es [-1, 1] y coincide con su adherencia. 
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Ejercicios y cuestiones propuestos 


1. Pruébese que v3, V5 y VT son números irracionales. 
2. Represéntese en la recta real y2 + v3. 


3. Encuéntrese los fracciones correspondientes a los números decimales 
2,135; 3,65 y —2, 27913. 


4. Aproximar y11 por un número racional con un error menor que una 
diezmilésima, esto es un error menor que 1074. 


5. Recordemos que el módulo p de un número complejo a + bi es p = 


b 
ya? +b? y su argumento 0 = arctag 2% 

Efectuar las siguientes operaciones de números complejos, determinar el 
módulo y argumento de su resultado y representar sus afijos en el plano 
complejo. 

a) i8 b)(1+i) O(v3-Dé+(1+5 d) (2-D(3-25) 

> -1 +i 

2— í 





6. Dado un conjunto M = {a,b,c,d} defínase una ley interna o de modo 
que (M, o) sea un grupo abeliano. 


7. Dado un conjunto M = {a, b, c, d, e} defínase una ley interna o de modo 
que (M, o) sea un grupo abeliano. 


8. Razónese si es un anillo o no lo es cada uno de los siguientes conjuntos 
con sus operaciones suma y producto habituales: 


a) El conjunto de los polinomios de grado menor que cinco. 
b) El conjunto de los polinomios de grado par. 
c) Las matrices de orden 2 x 3. 


d) El conjunto de todas las subsucesiones de una sucesión dada. 


9. Si z es un número real cualquiera encontrar un número irracional com- 
prendido entre 0 y z. 
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10. Encuéntrese para que valores de n > 1, los números siguientes son 
irracionales: 


a) Vir o o ll 


11. Razónese que el axioma del supremo es equivalente a “Si M es un 
subconjunto no vacío de numeros reales acotados inferiormente, entonces 
posee ínfimo”. 


12. Razónese que el supremo y el ínfimo de un conjunto de números reales, 
si existen, son únicos. 


13. Razónese porqué el orden de los números reales no se puede extender 
a los números complejos. 


14. Estúdiense si los siguientes conjuntos son acotados inferior y supe- 
riormente y, en su caso, determínense los conjuntos de cotas inferiores y 
superiores. 

a) (r€Q:1>T). 

n=5 ., . A 
b) U,_,(n, n +2) (unión de intervalos abiertos). 


c) {x €R:1<logz < 2) (log es el logaritmo decimal). 


15. A partir de la definición de valor absoluto, pruébese que si a > 0, la 
desigualdad |x| < a se cumple si y sólo si —a < x < a. 


16. "Teniendo en cuenta el resultado del ejercicio anterior, demuéstrese que 
a) |z + y] < |x| + lyl- 
b) lr] — ly] < [x—y]. 


17. Determínese el conjunto de los puntos de adherencia y acumulación 
de los conjuntos del ejercicio anterior. 


18. Recordemos que una sucesión de números reales es una aplicación s 
de N en R. Si s(n) = an, la sucesión se suele representar por su término 
general (an). Determínese, en su caso, el supremo e ínfimo de las siguientes 
sucesiones: 


2) G A ol 


19. Determínense las funciones |f(x)|, en donde 
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a) f(x) = cosx 
b) fa) =1324+x-2 
c) f(z) =2+senzx 


20. Determínese el supremo, el ínfimo, la adherencia, la acumulación y los 
puntos aislados del conjunto 


(A E Ry S ve) 


21. Determínese el supremo, el ínfimo, la adherencia, la acumulación y los 
puntos aislados del conjunto 


1 
[2-5 09=123,.. buu Se- in=123} 
2n n 








Capítulo 2 
Matrices y determinantes 


1. Introducción y objetivos. 


Las matrices, determinantes y la resolución de sistemas de ecuaciones li- 
neales forman parte de los programas de Bachillerato y son conocidos por el 
lector. El cálculo matricial constituye una herramienta esencial para desarro- 
llar los capítulos siguientes sobre espacios vectoriales. Esto nos ha movido a 
dedicarle este capítulo con el fin de repasar el tema y conseguir que el texto 
tenga el mayor nivel de autocontenido. 


Una matriz de orden n xm de elementos de un conjunto M es un cuadro o 
tabla de n filas y m columnas de elementos de M. Estudiaremos las operacio- 
nes y propiedades de las matrices de números reales, así como el concepto de 
determinante asociado a una matriz cuadrada, cuya utilidad encontraremos 
en el cálculo de la matriz inversa. 


Aunque su resolución aparecerá con frecuencia en estos primeros capítulos 
dedicados al álgebra lineal, no trataremos aquí de manera expresa los métodos 
de resolución de sistemas de ecuaciones lineales, con la seguridad de que el 
lector está al corriente de ellos y se halla familiarizado con el teorema de 
Rouché-Fróebenius, la regla de Cramer y el método de reducción de Gauss. 
Sin embargo, los incluiremos en los ejercicios propuestos 


El uso práctico de las técnicas matriciales es muy antiguo, lo utilizaron los 
chinos en el siglo II a. de C., y surge al intentar resolver problemas cuyo mode- 
lo matemático era en realidad sistemas de ecuaciones lineales. Estas primeras 
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técnicas, consistentes en operar con las filas y columnas de las tablas, dio lu- 
gar a fórmulas explícitas de resolución de los sistemas. Sin embargo, el proceso 
se prolongó mucho tiempo y hasta mediados del siglo XIX no se concluyó. 


Leibnitz ya conocía la fórmula general para resolver un sistema lineal de 
n ecuaciones con n incógnitas, pero no la publicó y durante un largo periodo 
el método consistió en reducir el sistema a una ecuación de la forma az = b, 
eliminando las otras incógnitas; hoy utilizamos un sencillo algoritmo ideado 
por Gauss. Es curioso que aún en el propio siglo XIX los únicos sistemas 
objeto de estudio eran los que tenían el mismo número de ecuaciones que 
de incógnitas, descartándose el estudio de los demás por considerarlos mal 
planteados. 


1.1. Objetivos. 


1. Sumar y multiplicar matrices. 
2. Conocer las estructuras algebraicas de los conjuntos de matrices. 


3. Conocer los diferentes tipos de matrices y determinar la matriz transpues- 
ta de una dada. 


4. Calcular el determinante de una matriz cuadrada. 
5. Aplicar las propiedades de los determinantes para facilitar su cálculo. 


6. Reconocer si una matriz posee inversa y calcularla. 


2. Matrices de números reales 


Una matriz de orden n x m de números reales es una tabla de n filas 
y m columnas de elementos de R. Cada número tiene asignada una posición 
(i, j) de modo que, fijado su orden, podemos representar una matriz genérica 
por (a;;), en donde i = 1,2,...,n y j = 1,2, ..., m, es decir 
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CANO Toena Alim 
api A2 como... Am Y 

= (aij) 
Anl n2  ....... Anm 


El conjunto de las matrices de orden n x m lo denotamos por Mpnxm- 
Como caso particular tenemos las matrices Mpnx1 


a las que llamamos matrices columnas, y las matrices Mi xm 


(E MA 


a las que llamamos matrices fila Una matriz se dice que es rectangular si 
n Á m, en caso contrario, es decir si n = m, se dice que es cuadrada. 


En el conjunto Mpnxm de las matrices de orden n x m se define la suma 
y el producto por un escalar de la forma siguiente 


(aij) + (bij) = (aiz + biz) A(aij) = (Mass) 


Si Ai, Áis,- Ai son filas o columnas de una matriz (aij) una combi- 
nación lineal de ellas es una suma de la forma 


AAi + A2Aja +... H Ap A 
en donde A1, A2, ..-., Ap son números reales. 
El par (Ma xm, +) es un grupo abeliano, cuyo elemento neutro es la matriz 


que tiene todos sus elementos 0, a la que llamamos matriz nula y denotamos 
por O. 
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Se puede definir el producto de dos matrices con la condición de que el 
número de columnas de la primera sea igual al número de filas de la segunda, 
es decir (a;;) € Mnxm y (bjk) € Mmxp, de la manera siguiente 


(Cik) = (aij) x (bix) = (E asb) 


de esta forma se obtiene una matriz de orden n x p. Obsérvese que el elemento 


cir de la matriz producto es el producto de la matriz fila de lugar ¿ de A por 
la matriz columna de lugar k de B. 


bik 
b 

2k = Qi1bik + Qi2b2k + .... + Qimmk 
Ok 


Por ejemplo el producto de una matriz de orden 3 x 2 por una matriz de 


orden 2 x 1 es una matriz de orden 3 x 1 


P E CANSO E) 290 
6 -2 en 6x5+(-2x(-D) |=| 44 
2 3 2 x 5+3 x (-7) —11 


Como es obvio, y siempre que estén definidos los productos, dado A x B 
decimos que B multiplica a A por la derecha y en B x A decimos que B 
multiplica a A por la izquierda. 

Es sencillo comprobar que si A es una matriz de orden nx m y By C 
son matrices de orden adecuado para que estén definidas las operaciones, se 
cumplen las siguientes propiedades 


Propiedades del producto. 


1. Ax(BxC)=(AxB)xC Propiedad asociativa. 
2. AxO=0, (O es la matriz nula del tamaño apropiado). 
3. AxX(B+C)=AxB+AxC. 
4. (A+ B)xC=AxC+BxC. 
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5. MAx B)=(A4)x B=Ax(AB) para todo NER: 


Nótese que la propiedad conmutativa no tiene sentido si las matrices son 
rectangulares, y aunque sí lo tiene para matrices cuadradas, tampoco en este 
caso se cumple en general: 


Una submatriz de una matriz Á es una nueva matriz procedente de 
suprimir filas o columnas de A. Si A es de orden n x m, las submatrices 
fila constan de m elementos y análogamente las submatrices columna de n 
elementos. 


Se llama matriz transpuesta 47de A a la que se obtiene cambiando 
filas por columnas, es decir, si A = (a;;), entonces AT = (aji). Por ejemplo 


D 2 
si A= [| —4 1 |, entonces AT = EA 
6 -2 2 1 -2 


Si A y B son matrices de tamaño adecuado para que estén definidas las 
operaciones es muy sencillo probar las siguientes propiedades. 


Propiedades de las matrices transpuestas 
TASASE 
2. (A+ B) = AT + BT. 
HAS E= A 
LASER A 
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3. Matrices cuadradas. 


El conjunto de las matrices cuadradas Mp es un anillo unitario para la 
suma y el producto. En efecto, a diferencia de lo que ocurre con las matrices 
rectangulares, el producto es una operación interna y ya sabemos que es 
asociativa, además posee elemento unidad que es la matriz cuyos elementos 
de la diagonal principal a11, 422, ..., @nn SON todos 1 y los demás elementos 
son 0 


DAA À 
2 0 1 0 
0 0". 1 


A esta matriz I se le llama matriz unidad y para cualquier otra matriz 


A € Mn se cumple que T x A = A x I = A. También es sencillo comprobar 
que se cumple la propiedad distributiva del producto respecto a la suma, 
A(B+C) = AB+ AC. Sin embargo el producto no es conmutativo como se 
ha mostrado en un ejemplo anterior, y el anillo no es abeliano. 


Se dice que B € Mn es la matriz inversa de A si 


B SASS = E. 


La matriz inversa, si existe, es única. En efecto si C fuese otra matriz 
inversa de A distinta de B, multiplicando la expresión anterior por C y 
teniendo en cuenta la propiedad asociativa del producto, resulta. 


(BARÁJSAC = BX(AXC) 
LO = JI 
O S "Bb 


La matriz inversa de A se denota por A”*. Una matriz cuadrada A se dice 
que es regular si posee matriz inversa. A las matrices no regulares también 
se les llama singulares. 
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Como existe elemento unidad para el producto, nos podemos preguntar 
si (Mn, X) es un grupo, es decir si cualquier matriz A € Mp posee matriz 
inversa. La respuesta en general es negativa como se muestra en el siguiente 
ejemplo 2.1. b). No obstante, podemos considerar el subconjunto M$ de Mn 
cuyos elementos tienen matriz inversa. Pues bien, (M%, x) es un grupo no 
conmutativo, ya que cumple la propiedad asociativa, posee elemento unidad 
y cada elemento posee inverso. Este grupo se llama grupo lineal de orden 
n. Como el producto no es conmutativo (Mž, +, X) no es un cuerpo. 


2.1 Ejemplos. 


il 
Ze sul 


0000-05) 


efectuando el producto e igualando las matrices se tiene que cumplir 


a) Veamos por la definición que la matriz A = ( ) tiene inversa. 


Si 


—a + 2b = 1, 3a +b = 0, —c + 2d = 0, 3c+d = 1 


sistema cuyas soluciones son a = —1/7, b = 3/7, c = 2/7, d = 1/7. Entonces 
nn 1/7 3/7 , 
he 
matriz A”* = ( 2/7 1/7 ) es la inversa de A ya que 
—1/7 3/7 m -13N (-13 $ ASTA E 
a ca O id A MIA NO 1 
: =9 e ; 
b) La matriz A = ( anpi ) no tiene inversa ya que si 


a b 3 ds a A 
Gu d 221) 10 1 
efectuando el producto e igualando las matrices se tiene que cumplir 


—2a-2b=1,a+b=0, —-2c-2d=0,c+d=1 


que no tiene ninguna solución. (Obsérvese que las dos primeras ecuaciones 
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son incompatibles). 


Una matriz cuadrada es una matriz diagonal si todos los elementos que 
no pertenecen a la diagonal principal son cero, es decir, aj; = 0 si t # j y la 
representamos por diag(a;1, 422, ..., Ann). Por ejemplo 


diag(a, b, c) = 


© OORA 
SiS TS 


0 
0 
E 


Una matriz cuadrada se dice que es una matriz simétrica si aj; = Qji 
para todo 1, j =1,2,...,n. Por ejemplo 


ade 
do y 
e e 


Más adelante utilizaremos estas dos clases de matrices. 


4. Determinantes. 


A una matriz cuadrada le podemos asociar un número que denominamos 
determinante. Su introducción viene asociada al estudio de los sistemas 
de ecuaciones lineales. Como ya comentamos, fue Leibnitz quien comenzó a 
utilizarlos en la resolución de sistemas lineales de tres ecuaciones con tres 
incógnitas. Al determinante de una matriz A lo designaremos por |A| o bien 
por det A. Recordemos su definición. 


Determinante de orden dos 


11 (012 
21 A22 


aa 


= (01102 — 012091 








a 
a 


Determinante de orden tres 
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411 Q12 013 
|A| = Q213 Q22 Q23 | = Q11 
a31 Q32 Q33 


a21 Q22 
a31 432 


Q2) Q23 
a3) Q32 


a22 Q23 
a32 Q32 


— 012 + 013 




















cuyo desarrollo puede comprobar el lector que es idéntico al que nos propor- 


ciona la conocida Regla de Sarrus 


|A| = aj1022033 + 091032013 + 431423012 — 013092031 — 023039011 — 033021012 


Determinante de orden cuatro 


011 Q12 Q13 Q1a 
| Al 421 Q22 Q23 Q4 
a31 Q32 Ugg Q34 
041 Q42 Q43 Q44 


Q22 Q23 024 Q21 Q23 024 Q21 Q22 Q24 
= Q11 | 432 033 Q34 | —QG12| a31 433 Q34 | + A13 | a31 a32 Q34 |— 
Q42 Ugg Q44 Q41 Q43 Q44 Q4) Q42 Q44 


Q21 Q22 023 
— Q4 | 431 Q32 433 
Ga Q42 Q43 


De esta manera podríamos definir sucesivamente los determinantes de 
orden cinco, seis, ..., etc. Obsérvese que en todas las expresiones anteriores 
el determinante es la suma algebraica de los elementos de la primera fila 
por el determinante de la submatriz asociada a ese elemento, es decir de 
la submatriz obtenida al suprimir la fila y columna del elemento, y que el 
signo que precede al sumando es + si 1 + j es par y —1 si 1 + j es impar. 
Con un simple ejercicio de cálculo se puede comprobar que el resultado es 
el mismo si hubiésemos utilizado los elementos de cualquier fila o columna y 
los determinantes de sus submatrices asociadas. 

En general, dada una matriz cuadrada A de orden n, designamos por 
A;j la submatriz asociada al elemento a; obtenida al suprimir la fila 2 y la 
columna 3. 


Definición de determinante. Sea A una matriz cuadrada de orden n > 
2. Se llama determinante |A| de A a la suma de los números (-1)Wa,j |Ax yl, 
es decir 
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14] = anı 141,1) — a12 141,2] +... + (1) dam 14 ,n! 


Como hemos dicho el determinante de A se puede obtener utilizando 
cualquier fila o cualquier columna. La expresión si consideramos la fila 1 es 


|A| = (Das 14; 1] + (Das |4;2] +... + (Dan | Aj! 
y si consideramos la columna j es 


|A| = (1) ar 141,51 + Das 42,5] +... + ("Wang | An,s! 


Obsérvese que en cada uno de los sumandos del determinante interviene 
un único elemento de cada fila y un único elemento de cada columna. Además, 
de acuerdo con la definición, es claro que el determinante de una matriz 
cuadrada y el de su transpuesta son iguales |A| = AT] 


2.2. Ejemplos. 


a) Determinemos utilizando la tercera columna el determinante de la 
matriz 


pr QUE 
0-1 3 0 
A= = 
—1 1 0 P 
Se tiene 
0-10 10 -—1 1 0 —1 
A E R e O + (-5) 0-1 0|- 
—1 1 2 —] 1 2 —1 1 2 
1 0 —1 
AN AS NI 
—2 1 1 


b) Calculamos el determinante de la matriz 
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mediante los elementos de la columna 2 y de la fila 3 y comprobamos que el 


resultado es el mismo. 














lil -1 0 —-1 0 
=(-31y1+2 agi q 3+2 a 
O A T glt] T 
sh ee 
3 0 1 0 —1 3 
3+1 —q13+2 3+3 a 
A] = (13 5 1 |+6D 0 +C 2 R 
=DE 2S 


Al determinante |A; ¿| se le denomina menor asociado al elemento as; 
y a (—1)™ |A; ¿] se le denomina adjunto de a;j y se representa por Aj. De 
este modo podemos referirnos al desarrollo del determinante por los menores 
o los adjuntos asociados a los elementos de una fila o columna. En general, 
se llama menor al determinante de una submatriz cuadrada y orden del 
menor al de la submatriz. 


Obsérvese que el número de operaciones necesario para calcular los deter- 
minantes de matrices de orden alto (n > 5) es muy elevado. Las propiedades 
que enunciamos a continuación nos permiten reducirlo logrando ceros en los 
elementos de la fila o columna por la que vamos a desarrollar. Sus demostra- 
ciones se reducen a meros cálculos. Recordemos que las matrices son de orden 
n. 


Propiedades de los determinantes. 


1. Si una matriz A tiene dos filas (o columnas) iguales, entonces su de- 
terminante es cero. 


Demostración. Probémoslo por el método de inducción. Para n = 2 es 
cierto ya que 





a b 
a |= a-a=0 
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Supongámoslo cierto para n — 1. Si dos filas son iguales, por ejemplo las 


correspondientes a ¿y e 1,, desarrollando por los elementos de cualquier otra 
fila ¿ distinta a ellas, se tiene 


14] = (1) aa |Air] + (Da 14,0] +... + (1) ain | Ain! 


ahora bien todas las matrices A; 1, A;2,..., Áin son de orden n — 1 y tienen 
iguales las filas ¿y e 21, entonces por hipótesis todos sus determinantes son 
cero, es decir 

|A] = Ail = = Ain] =0 


con lo que |A| =0. O 


2. Si a una fila (o columna) de una de una matriz A le sumamos otra fila 
(o columna) de la matriz, entonces el determinante de la matriz B resultante 
es igual al determinante de A, es decir |B| = |A]. 


Demostración. Por inducción. Es cierto para n = 2 ya que si A = ( : . ) 


y B es la matriz resultante de sumar la segunda fila a la primera. 


a+c b+d 


|B| = C d 


|= a+ od- (+ dje= ad+ ed- be- cd = 








Supongámoslo cierto para n—1 y consideremos que a la fila ¿ le hemos sumado 
la fila k. Desarrollando la matriz B por los elementos de la fila 2 


|B| = DP aa Bra] + (10)%+Wa: |Bio] +... + (—1) tain | Bi, 


Ahora bien, todos las matrices B; 1, B;2,..., Bin son de orden n — 1 y, por la 


hipótesis de inducción, sus determinantes son iguales a los correspondientes 
A: 1, Az2, a Ain de la matriz A, esto es 


|B;1] = 14:11, |Bi2] =144,2], ... | Bin] = An] 


con lo que resulta |B| = |A]. O 


> 
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3. Si una fila (o columna) la multiplicamos por un número A, entonces 
el determinante de la matriz B resultante es igual al determinante de A 
multiplicado por A, es decir |B| = A |A|]. 


Demostración. Supongamos que hemos multiplicado los elementos de la 
fila ¿ de A por A, entonces calculando det B por los menores asociados a los 
elementos de esa fila y sacando factor común a A se obtiene el resultado. Esto 
es 


D= (— D |A;, 1| + (— o |A; 2] + .... + (Dian |Ainl = 
=A [(=1 a Aral + (Dag Ajo] +... + (1) ain |Ainl] =\]JA| 
C] 


4. Si una fila (o columna) de una matriz A es combinación lineal de otras 
filas (o columnas), entonces el determinante de A es cero. 


Demostración. Es consecuencia inmediata de las propiedades anteriores. 
En efecto si la fila ¿ es combinación lineal de las filas h y k, entonces det A = 0 
ya que det A = det B, en donde B es la matriz procedente de restar a la fila 
i la combinación lineal de las filas h y k, es decir de restar los elementos de h 
y k, multiplicados por los respectivos escalares de la combinación lineal. Por 
tanto todos los elementos de la fila ¿ de B son cero y det B = Q. 


5. Si a una fila (o columna) de una matriz A se suma una combinación 
lineal de las demás el determinante de la nueva matriz B es igual al deter- 
minante de A. 


Demostración. Es consecuencia de las propiedades anteriores, ya que si 
desarrollamos por los elementos de la fila ¿ a la que hemos sumado una 
combinación lineal de los elementos de la filas h y k, se tiene 


|B| = (-1)%* (an + aan + Barı) 1411 + (1)+(4:2 + aan + Baro) [Aso] + 
E (=D a O + BA ten) |Ainl = 
= (Das [As 1] + (=1) oy [Aj 2l +... + (1) [Ain] = |A| 


ya que por la propiedad 4 
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(1) (œan + barı) 14,11 + (-1D)(00r2 + Baro) [Aiz] + 
+... + (—1)F"(0 pm + Larn) Ain] = 0 
pues es el determinante de una matriz cuya fila ¿ es combinación lineal de las 
filas h y k. EJ 
6. Si dos filas (o columnas) de una matriz A se permutan entre si, el 


determinante de la nueva matriz B es —|A]. 


Demostración. Es claro que se cumple para n = 2. Supongámoslo cierto 
para n— 1 y que hemos permutado las filas ¿ y h de A, desarrollando por la 
fila i, se tiene 


|B| = (—D0* ari Bi] + (17t ar |Bi 2l +.. F (—1) tann ¡Bin! 


(Obsérvese que los elementos de la fila ¿ de B son los elementos de la fila 
h de A ). Como por hipótesis los determinantes de orden n — 1 cumplen 
|Bi,1| e [Anıl Y |B; 2l ÓN [47,2 O [Ba ma [Ann] 


resulta, sacando factor común —1,que 


1B] = =A A + (DW ana A +... a an Al = 
- e 


Un buen ejercicio es realizar las demostraciones anteriores para matrices 
de orden 3, lo que sin duda alguna ayudará a clarificar la notación (aparente- 
mente complicada). Las propiedades 2 (adición), 3 (dilatación) y 6 (per- 
mutación) se suelen conocer con el nombre de operaciones elementales. 


2.3. Ejemplos. 


a) Apliquemos las propiedades anteriores para calcular el determinante 
de la matriz 
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1 3 2-1 
2 1. 40 
As —4 22 3 
5-3 6 4 


LA 
2 -1 4 0 
puna -1 114 0 
pegng 4 


Multiplicando la primera fila por 4 y sumándola a la cuarta 


> ro 
2 =1 M4 
ai a as 
9 +9 Wad 0 


Por la propiedad 5, los determinantes de las tres matrices son iguales, 
|A| = |B| = |C|. Si calculamos |C| por los menores de la última columna, 
hemos reducido el cálculo al de un determinante de orden tres. 


2-1 4 
IC|= (-D*(=D|-1 11 4|=-246 
9 9 14 


b) Comprobemos la segunda propiedad para n = 3. Supongamos que a 
la primera fila de la matriz fila 


abc 
A= e 
g h l 


le sumamos su segunda fila, entonces 
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a+d b+e c+f 


Bj=| da e f l= 
g h l 
= (a+ d)(el — hf) — (b + e)(dl — gf) + (c+ f)(dh — eg) = 
abc 
= ael + dhc + gfb — ceg — fha —ldb=| d e f |=14] 
g h l 


Una última propiedad, cuya demostración omitimos, es que el determi- 
nante de un producto de matrices es el producto de los determinantes. 


det( AB) = det A det B 


Como consecuencia el determinante de la matriz inversa es el inverso del 
determinante de la matriz, es decir 


1 
=l 

da a= det A 

Se llama rango de una matriz al orden del mayor menor no nulo. 
Es claro que el rango de una matriz de orden n x m puede valer como 
máximo mín {n,m}. Para calcularlo, localizamos un determinante de orden 
2 x 2 distito de cero y orlamos la submatriz con una fila y una columna, 
obteniendo una submatriz de orden 3 x 3 y así sucesivamente. Si a partir 
de un orden p < mín {n,m} los determinantes son todos nulos, tenemos 
que comprobar si el resto de los menores de orden p son cero, en cuyo caso 
el rango es p — 1. Si existe alguno distinto de cero, orlamos su submatriz y 
continuamos el proceso. 





2.4 Ejemplo. 


a) Determinemos el rango de la matriz o 
310.2 1/40 
o pE 5 
TD =T 5% 
6 1 3 DIU 
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Como la matriz es de orden 4x 6, el rango como máximo puede ser cuatro. 


3 W -2 I 
SE 2 
3 0 IE 
i [meia E AP La a piir ES 
6 l SD 
Su rango es cuatro. 
b) Determinemos el rango de la matriz 
6 1 4 
4 3 -2 
a e 
E i. 


Como la matriz es de orden 4 x 3, el rango como máximo puede ser tres. 


UA 
HE" MA E 
se 


El último determinante es cero, tenemos que ver si existe una submatriz de 
orden 3 cuyo determinante sea distinto de cero 


Oma al 6 14 
143 Slao DO 
e E 2 


Podemos comprobar que todos los determinantes de orden tres son cero con 
lo que el rango es dos. 


5. Matriz inversa. 


A continuación caracterizamos la existencia de matriz inversa AT! de A 
y determinamos su 'expresión. Para ello necesitamos el concepto de matriz 
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adjunta y una sencilla propiedad sobre las combinaciones lineales de los ad- 
juntos. 


Se denomina matriz adjunta de A a la matriz (4 ) obtenida al sustituir 


los elementos (a;;) por sus adjuntos A; 


adjuntos de los elementos. 


, es decir a la matriz formada por los 


2.5. Ejemplo. 


Calculemos la matriz adjunta de 


2 -13 
rro 
23 571 
como 
ANN e E a a al. ¿0 
aai |= 20, Af = 2 r= 13, Aj = 35 = 0 
e E R 2 2003 A PASAS 
A) = | 5 1 OS ZN z1 = ia oe 7 
al LE a o aa 3 ES 
de | Vicio lia DE e oea 1.0 Sn 
la matriz adjunta de A es 
A T —20 -13 5 
AAA A 16 11 —7 
ASA A —4 -—5 1 


Proposición La suma de los productos de una fila (o columna) de A, 
por los adjuntos de otra fila (o columna) es cero. 


Demostración. Consideremos las filas ¿ y k y sea B la matriz que se obtiene 
sustituyendo en A la fila k por la fila +. Como B tiene dos filas iguales su 
determinante es cero, |B| = 0. Pero si desarrollamos |B| por los elementos 
de la fila k, utilizando los adjuntos, se tiene 
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Caracterización de la matriz inversa. La matriz inversa de A existe 
si y sólo si su determinante es distinto de cero, en cuyo caso su matriz inversa 


A`! es igual a la traspuesta de la matriz adjunta dividida por el determinante 
de A 


ANA A Al 

yu ll UI... A? 
lo. o en W 
ARAR co. yn 


Demostración. Supongamos que |A| 4 0 y probemos que la matriz ante- 
rior, a la que ahora designamos por B, es la inversa de A. En efecto 


011 Qp dte Qin Al Al >aUO Ra Al 
Aip- 091 Q22 seses An J 1 A? A? Ma A? 
e e P. |A| aa T 
an amr ds nm A MA a Ar 
por tanto 
A aik Af ya aik AL gonbo A aik AR 
n n k n 
ANDE pil ya. A azp Ar e azk AL os oor aop AE 
|A] r nan AA e 
o Do A cs a a 
con lo cual 
|A| Dio ss 0 
OA 0 
A x B = — 
al MO A .. 
0 A ot |A| 


ya que todos los elementos de la diagonal principal son iguales a |A| , pues son 
los desarrollos, utilizando sus adjuntos, mediante los elementos de las filas 
1,2,...,n respectivamente. Por otro lado, teniendo en cuenta la propiedad 
anterior, los demás elementos son cero, ya que se trata de la suma de los 
productos de una fila por los adjuntos de otra fila. De forma análoga se 
comprueba que B x A = I. Como consecuencia B = A”?, 


Recíprocamente. Supongamos que la matriz inversa AT! existe, entonces 
necesariamente tiene que ser AT! = B, ya que la matriz inversa de A es 
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única. Por tanto, si A7* existe forzosamente el determinante de A tiene que 
ser distito de cero, |A| 40. O 


Como consecuencia inmediata del resultado anterior una matriz A es 
singular o no regular si su determinante es cero, |A| = 0. 


2.6. Ejemplo. 


Determinemos la matriz inversa de la matriz A del Ejemplo 2.5. Los 
determinantes de A y la matriz traspuesta (4%) de la matriz adjunta (47) 
son 


2 -13 —20 16 -4 
=3 51 5 —T 1 
con lo que 
—20 16 —4 3 5 l 
e 1 
A -13 11 5 | = Lo 2 
A 
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Ejercicios y cuestiones propuestos 


E OS: 1 a 

1. Sean las matrices A = 3 2 -1 -3 | y B= 
-3 -—2 
6 0 1 1 0 3 


a) Pónganse dos ejemplos de las siguientes clases de submatrices de A: 
i) fila, ii) columna, iii) cuadradas de distinto orden. 


b) Efectúese el producto A x B. 
c) Compruébese que (A x B)? = BT x AT. 


2. Efectúense las siguientes operaciones: 


1-10 
EEE E IZ 
-2 04 
y determínese la matriz transpuesta del resultado. 


—=2 


3. Dada la matriz A = ( 4 


AxB=0. 


e ) , encuéntrese una matriz B tal que 


4. Si A, B € Mi, ¿es cierto que (A + B}? = A? + B? + 24B?. 


5. Dadas las matrices A = ( 4 3 ) yB= ( i d ) . Determínese: 


a) A?-2AB-—B?. (Notación A? = Ax A, en general A” = AX Ax...x A). 
c) (A+ B-D(A+B+1) 


6. Rázonese si son ciertas o falsas las siguientes cuestiones: 

a) Si A, B € Mnxm y C € Mm son tales que (A — B) x C = O, pruébese 
que A = B. 

b) Si A,B,C € M} y se cumple 47*(B + X)C7?* = I, encuéntrese la 
matriz X. 

c) Si A E€ Mn y B, AB € M3, pruébese que A € Mi 
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Q 
b 
distintos de cero. Pruébese que el conjunto de esta clase de matrices y la 
matriz nula con las operaciones usuales constituye un cuerpo. 


7. Compuébese que la matriz A = es regular si a o b son 


9. Calcúlese A’, en donde A es la matriz 
cos —seno 
sena coso 

¿Cuál es la expresión de A”? 


10. Calcúlese el valor del determinante de la matriz 


veen A 
Onm wy 
Hrer rG 


—1 
2 
2 
= 4 


mediante los adjuntos de la fila dos y mediante los adjuntos de la columna 
cuatro y compruébese que se obtiene el mismo resultado. 


11 Aplíquense operaciones elementales para calcular el determinante de 
la matriz del ejercicio anterior mediante los adjuntos de la primera columna 
en la que todos sus elementos deben ser cero salvo uno de ellos. 


12. Aplíquense operaciones elementales para calcular el determinante de 
la matriz 


Band, ¿0 11 3 
kh Y 2 4d 
S =3 "0-2. 
E 2 —I =] 
za E ¿LA 


13. Sean A y B dos matrices cuadradas. Razónense las siguientes propiedades. 
a) Si el producto de A y B es regular, entonces las matrices son regulares. 
b) Si A verifica la relación 4? + A + I = 0, entonces A es regular. 


14. Contéstese a las siguientes cuestiones: 
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a) ¿El producto de dos matrices diagonales de orden n es a su vez una 
matriz diagonal?. 

b) Sea D* el conjunto de las matrices diagonales, cuyos elementos de la 
diagonal son todos distintos de cero. ¿D*U {0} es un cuerpo? 


15. Determínese, en su caso, la matriz inversa de las matrices de los ejer- 
cicios 2, 3, 5, 8 y 10. 


16. A partir de las ecuaciones matriciales determínese, en su caso, las 
ecuaciones de la matriz X en función de la matriz Y. Razónese que sucede 
en cada caso. 


a) 


Yı 1 2 —1 Tı 

Y |= 03 -—2 Lo 

Y3 —1 4 1 T3 
b) 

Y1 1. 2 -—1 Tı 

Yo = 0 3 —2 T2 

Y3 1 —1 1 T3 


17. Resolver los dos sistemas del ejercicio anterior si 


yı 1 
y | = 0 
Y3 >] 


Explíquese el método de resolución . 


18. Calcúlese el rango de las matrices 


a) 


LO T) B2 jo 
A= 20 2 TME e = T "10. -3 2 
To Ela OL = i 

b) 
y e g 
cl? A a os "O 
"Aiz 2 TO AA 
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19. Resuélvanse los sistemas de ecuaciones lineales, en donde las matrices 
A, B son las del ejercicio anterior, en los siguientes casos. 


1 
AX = PBX Pa — pa y 
0 


20. Resuélvanse los sistemas de ecuaciones lineales, en donde las matrices 
C, D son las del ejercicio 18, en los siguientes casos. 


Tı 2 
To —1 
a) CX = P, en donde X = yP 
T3 3 
T4 1 


Ti 1 

T2 —1 

b) DX =P,en donde X= | 2x3 | y P= 0 
T4 2 

T5 3 





Capítulo 3 
Espacios Vectoriales 


1. Introducción y objetivos. 


Existen estructuras algebraicas que además de operaciones internas en el 
conjunto M involucran otras operaciones relacionando los elementos de M y 
los de otro conjunto P. Estas operaciones se llaman externas. 


Dados conjuntos cualesquiera P y M, una operación o ley de com- 
posición externa x en M sobre el conjunto P es una aplicacion de P x M 
en M, es decir, es una relación que a cada par de elementos A de P y a de 
M le hace corresponder un elemento de M que designamos por Ax a. 


Si M tiene una operación interna o y una operación externa x sobre el 
conjunto P, entonces se dice que 
x es distributiva respecto a o si Ax(aob)=(Axa) o (AxbD). 


1.1. La estructura de espacio vectorial. 


La estructura más importante en la que interviene una operación externa, 
es la de espacio vectorial; su estudio constituye el contenido fundamental 
de este capítulo. En ella intervienen un grupo conmutativo (V, +) y una ley 
externa de Y sobre un cuerpo (K, +, -), que cumple entre otras la propiedad 
distributiva anterior. 
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Un ejemplo ya conocido por el lector es el espacio Va de los vectores 
fijos del plano. Un vector fijo OP se representa geométricamente mediante 
una flecha que comienza en el origen de coordenadas O = (0,0) y termina 
en un punto del plano P = (a,b), llamado afijo, de modo que existe una 
correspondencia biunívoca entre los vectores de Vaz y los puntos del plano 
cartesiano. Si consideramos OQ, en donde Q = (c, d), la suma OP + OQ de 
dos vectores es el vector OM determinado por la diagonal del paralelogramo 
que definen ambos vectores, siendo M el punto (a + c,b + d). El producto 
de OP por un número real A es el vector AOP = OH tal que H es el punto 
(Aa, Ab). Es muy sencillo comprobar que Va cumple las propiedades de espacio 
vectorial que estableceremos formalmente más adelante. 


A principios del siglo XVII Descartes introdujo las coordenadas carte- 
sianas o rectangulares en el plano (e implícitamente los vectores) y junto 
con Fermat estudiaron la geometría análitica. A mediados del siglo siguien- 
te Laguerre y Clairaut ampliaron el sistema de coordenadas al espacio de 
tres dimensiones y desarrollaron allí la geometría. Sin embargo fue Lagrange 
quien comenzó a representar las magnitudes físicas, fuerzas, velocidades y 
aceleraciones, por medio de segmentos con punta de flecha dotados de una 
longitud y una dirección específicas. A estos segmentos se les llamó vectores 
y su uso se generalizó con el avance de la teoría de la electricidad. A finales 
del siglo XIX, Peano estableció una definición axiomática de espacio vecto- 
rial, casi idéntica a la que se da hoy, culminando el proceso de abstracción 
iniciado por Grassmann. 


1.2. Objetivos. 


1. Reconocer los espacios y subespacios vectoriales. 

2. Conocer si un sistema de vectores es linealmente independiente. 
3. Conocer los espacios de dimensión finita y determinar sus bases. 
4. Determinar el rango de un sistema de vectores. 

5. Determinar los subespacios generados por un sistema de vectores. 


6. Conocer los cambios de base y calcular las coordenadas de un vector 
en una nueva base. 
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7. Determinar la dimensión de los subespacios y sus ecuaciones. 


2. Espacios y subespacios vectoriales. 


Para establecer la definición de espacio vectorial consideramos un conjun- 
to V y un cuerpo K. 


Definición de espacio vectorial. Se dice que V es un espacio vectorial 
sobre el cuerpo K si: 


1. V tiene definida una operación interna, que denotamos por +, res- 
pecto a la cual (V, +) es un grupo abeliano, es decir, si u, v, w son elementos 
de V se cumple: 


u + (v + w)= (u+v)+w Ley asociativa 

O es el elemento neutro Existencia de elemento neutro 
Para cada u existe simétrico —- u Existencia de elemento simétrico 
u+v=v+u Ley conmutativa de la suma 


2. V tiene definida una operación externa sobre sobre K, que deno- 
tamos por un punto -, para la cual, si A, y son elementos de K, se cumple: 


à: (u +v) = T u+A:.v Distributiva respecto a la suma de V 


A+p):v=A: u+u:.v Distributiva respecto a la suma de K 
Alu- u) =(A i -u Asociativa respecto al producto de K 
lx -u=u lx es el elemento neutro del producto 


A los elementos de un espacio vectorial les llamamos vectores. En todo lo 
que sigue consideraremos siempre que K es el cuerpo R de los números reales, 
a cuyos elementos llamamos escalares o números. Si no existe confusión 
omitiremos el signo producto -. 
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Los ejemplos de espacio vectorial que se dan a continuación están forma- 
dos por conjuntos y operaciones conocidos por el lector. La comprobación de 
que satisfacen las propiedades anteriores es en todos los casos muy sencilla y 
se deja como ejercicio. 


3.1. Ejemplos. 


a) El espacio Va de los vectores fijos del plano se identifica con el espacio 
de las coordenadas de sus afijos, es decir con R? = {(x, y) : x,y € R} y las 
operaciones 


(11,41) + (22, Y2) = (21 + To, Y1 + Y2) 
Mx, y) = (Az, Ay) 


b) En general, el conjunto de las n-uplas ordenadas de números reales 
RAE IDA) SUN eR] 
con las operaciones 
(£1, T2; -3 n) aF (yı, Y2; -3 En) = (21 da Yı, T2 ate Y2,- Tn aL Yn) 
AD. En) (Aa ALA) 
es un espacio vectorial. 


c) El conjunto de las matrices de números reales de dos filas y tres colum- 
nas 


Mah (e pao aa oyeR 11,2 yaala 


Q21 Q22 423 


con las operaciones 


( Q11 Q12 Q13 ) e ( biy bi2 bi3 ) - ( a11 +b11 a12 +b12 013 + big ) 


a21 Q22 Q23 a21 + b21 a22 +b22 023 + b23 


X 411 412 (13 > Aa11 Aai Aag 
Q21 Q22 423 Aa91 Ada Aa23 
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es un espacio vectorial. 


En general, el conjunto Mnxm de las matrices de orden n x m con las 
operaciones anteriores es un espacio vectorial 


d) El conjunto de las funciones del intervalo [—1,1] en R 
F=4(f:|[-1,11] >R) 
con las operaciones 
(F + 9)(2) = f(z) + g(x) 
Af) (=) = Af (2) 
es un espacio vectorial. 


e) El conjunto de los polinomios 


P(x) = {p(z) = Ant” + acli a. arao + 41% + ao : q; € R} 
con las operaciones 


p(£) + q(2) = ant” +... + (am + bm)T™ +... + (a1 + b1)x + ao + bo 
Ap(2) = Aant” +... + AQ TI" A o... + Aaz + Ao 


en donde q(x) = ba” + bat + bizo + bo, y hemos supuesto que 
m < n, es un espacio vectorial. 


Estudiamos a continuación en que condiciones un subconjunto E de un 
espacio vectorial V “hereda” la estructura de espacio vectorial, es decir cons- 
tituye asimismo un espacio vectorial para las operaciones definidas en V, en 
cuyo caso decimos que es un subespacio vectorial 


Definicion de subespacio vectorial. Un subconjunto no vacío E de un 
espacio vectorial Y sobre R es un subespacio vectorial de Y si a su vez E 
es un espacio vectorial con las operaciones suma y producto por un escalar 
inducidas por las operaciones de V. 


Es claro que si (E, +, -) es un subespacio vectorial de (V, +, -), entonces + 
tiene que ser una operación interna para E, es decir dados dos elementos a y b 
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de E su suma a+b es un elemento de E. Asimismo el producto por un escalar 
A, es decir Aa debe de ser un elemento de E. Además como (E, +) tiene que 
ser un grupo abeliano, el vector O neutro de la suma y el vector simétrico 
—a de a también tienen que pertenecer a E. Por otra parte, (E, +, -) cumple 
todas las otras propiedades de espacio vectorial ya que E es un subconjunto 
de V. 


Evidentemente {0} y V son subespacios de Y, cualquier subespacio dis- 
tinto de ellos se dice que es un subespacio propio. 


Caracterización de subespacio vectorial. Un subconjunto E de un 
espacio vectorial V es un subespacio vectorial si y solo si para todo a,b € E 
y todo A, y € R se cumple que àa + ub € E. 


Demostración. Si E es un subespacio vectorial de V, entonces a su vez es 
un espacio vectorial y por tanto Aa + ub € E. 


Reciprocamente. Si Aa + ub € E, para À = u = 1 se tiene a+ b € E y + 
es una operación interna de E . Si y = 0, entonces Aa € E y el producto de 
un escalar por un elemento de E es un elemento de E. Para A = u = 0, se 
tiene O € E. Finalmente si A = —1 y u = 0, se tiene —a € E y el elemento 
simétrico de a pertenece a E. 


Veamos un ejemplo de subespacio vectorial en cada uno de los espacios 
mostrados en los Ejemplos 1.4. En todos los casos su comprobación, utilizan- 
do la caracterización anterior, es inmediata. 


3.2. Ejemplos. 


a) El subconjunto E = ((x, y) € R? : 3x + y = 0), o lo que es equivalente 
el conjunto de pares de la forma (x, —31) es un subespacio de R°. En efecto: 


A(a, —3a) + u(b, —3b) = (Aa, —32a) + (ub, —3 pb) = (Ma + ub, —3(Aa + ub)) 


y (àa + ub, —3(àa + ub)) € E. 


Observemos que la representación geométrica de E es la recta 3z +y = 0. 
En general cualquier recta del plano que pasa por el origen es un subespacio 
vectorial de R?. Si la recta no pasa por el origen, por ejemplo x + y = 1, el 
conjunto de pares (x,y) que la cumplen no puede ser un subespacio ya que 
(0,0) (neutro de la suma) no pertenece a la recta. 
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b) El subconjunto E de Rê formado por los elementos de la forma 
x=, 0 33, TAO) 
es un subespacio vectorial. En efecto, si y = (y1, 0, Y3, Ya, O, ys), se tiene 
AX + uy = (Azı + uy, 0, Als + yz, Ala + ya, 0, ALe + Hye) 
y Ax + uy EE. 


c) El subconjunto E de las matrices de MM2x3 de la forma 


a= 0 012 0 ) 
da 0 az 


es un subespacio vectorial de Məx3, ya que 
0 012 0 0 biz 0 ) 
A 
( da 0 az ) sah o, 0 da 


( 0 Aa12 ap ubiz 0 ) 
Ad91 + uba 0 Aa93 + ub23 


y por tanto un elemento de E. 


es la matriz 


d) El subconjunto E de las funciones del intervalo [—1, 1] en R tales que 
toman el valor cero en cero, es decir f (0) = 0, es un subespacio del espacio 
F (Ejemplo 3.1. d)), ya que si f y g pertenecen a E, se tiene 


AF + ug) (0) = Af (0) + ug(0) = 0 
yàf+ugEE. 


e) El subconjunto P(x) de los polinomios de grado menor o igual que 
cinco es un subespacio vectorial de P(x). En efecto si 


p(x) = asi? + asz“ + aga? + azz? +b12 + ao 
q(x) = bsx” + baz + baz? + boz’ + biz + ao 
entonces Ap(x) + uq(x) es un polinomio de grado cinco. 
f) Si E; y Ez son subespacios de V, es obvio que su suma 
E, +E = {a +b :a € E,b € Es) 


es un subespacio de Y. 
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3. Sistemas de generadores y bases. 


En todo lo que sigue Y es un espacio vectorial. Lo primero que vamos 
a estudiar es una manera sencilla de obtener subespacios vectoriales de V 
mediante subconjuntos cualesquiera S de vectores de V. El subespacio E 
asociado a S decimos que está generado por $. 


3.1. Sistemas de generadores. 


Sea una familia de vectores S = [v;, va,..., Vp} de V. Se llama combi- 
nación lineal de v;, va, ..., Vp a todo vector u € Y tal que existen escalares 
A1, Az, ..., Ap de modo que se cumple 


u = A] V1 aj A2 Vo ae E Ap Vp 


Es claro que todas las combinaciones lineales de la familia {v1, va, ..., Vp} 
constituyen un subespacio vectorial, ya que si w es otra combinación lineal, 
W = UV] + H2V2 +.... + pvp, se satisface la caracterización de subespacio. 
En efecto, sea œ, 8 € R, se tiene 


au + Bw = (0) + Bp1)v1 + (0% + Bpua)va + .... + (0Ap + Blip) Vp 


y au + Sw es una combinación lineal de v;, va, ..., Vp. Esto nos lleva a la 


siguiente definición, en la que se considera una familia no necesariamente 
finita S de vectores de V. 


Definición de sistema de generadores. Una familia S de vectores de 
Y se denomina sistema de generadores de un subespacio E si cada vector de 
E se puede expresar como combinación lineal de un número finito de vectores 
de S. 


En otras palabras el conjunto de todas las combinaciones lineales finitas 
de los elementos de S constituyen el subespacio E. Entonces decimos que 
S genera E. Debemos observar que S puede estar formado por infinitos 
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vectores, pero cada elemento de JE se obtiene mediante la combinación lineal 
de un número finito de elementos de S. Veamos algunos ejemplos. 


3.3. Ejemplos. 
a) El vector (2, —1, —3) es combinación lineal del sistema 
S =((0,1,1), (1,1,0)) 


de R? ya que 

(2, —1, -3) = —-3(0, 1,1) + 2(1, 1,0) 
sin embargo (3, 2,1) no es combinación lineal de los vectores de S, ya que no 
existen dos escalares À y y tales que 


510 ye dudo 


pues el sistema de ecuaciones 


no tiene solución. 


b) El sistema S = ((1,0,0), (0, 1,0), (0,0,1)) de R? genera todo R*. En 
efecto, cualquier vector (a, B,y) € R3 se puede representar mediante una 
combinación lineal 


(a, B,y) = a(1,0, 0) + B(0, 1,0) + y(0, 0, 1) 


En general, razonado de la misma manera, es claro que un sistema de 
generadores de R”, conjunto de las n-uplas (1,,T2,..., Li, ..., 2n) de números 
reales, lo constituye la familia de vectores 


tey= 00 Dad ei 
¿-ésima posición 
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c) El sistema de polinomios S = (1,1,1?, 23,... gto! gel, ......] genera 
el subespacio de P(x) cuyos elementos no poseen el monomio de grado n, es 
decir el monomio de la forma Ax”. Es obvio que si a S le añadimos z”, el 
sistema S' = SU (x”) genera todo el espacio P(x). 

Obsérvese además que tanto el sistema S como S’ constan de infinitos 
elementos y que cada polinomio que generan es la combinación lineal de un 
número finito de elementos del sistema. 


0 0 0 —2 
matrices cuadradas Mə formado por las matrices diagonales de orden 


dos. 
A X 1 0 H 0 0 
Ou 0 0 DADA 


Dado un sistema de generadores de un subespacio E, hay dos hechos que 
conviene destacar. El primero es que un elemento de E puede tener distintas 
representaciones. Por ejemplo, para el sistema 


S = ((1,0), (1t). (2, DD) 


de R? el vector (2,2) puede representarse por 


d) Las matrices ( A ) y ( o ) generan el subespacio de las 


(2,2) = (1,0) + (-1,1) + (2,1) 
9 


(2,2) =-(1,0) + (1,1) + Ž(2,1) 


(2,2) = —8(1, 0) — 2(-1,1) + 4(2, 1) 


El segundo es que sistemas de generadores con diferentes números de vectores 
pueden generar el mismo subespacio. Por ejemplo, los sistemas 


S = {(1,0, yk (e 1,0)} 
SS {(1, 0, iy els 1 0), (-1, 0, —1)} 


generan el subespacio de los vectores (x, y, 2) tales que ~x + y + z = 0. (Es 
muy sencillo comprobar que tanto los vectores generados por S 


ONO) PEA) 
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como los vectores generados por S' 


AO O aa a A 


cumplen la ecuación —1 + y + z = 0, basta sustituir los vectores genéricos 


anteriores y ver que en ambos casos se cumple la ecuación. 


3.1. El concepto de Base. 


Como consecuencia del comentario anterior, lo deseable, por un lado, es 
encontrar sistemas de generadores que tengan el menor número de vectores 
para generar el subespacio, y por otro que la representación de cualquier 
vector en función de los vectores del sistema sea única. Esto nos lleva al 
concepto de base. 


Definición de base. Se dice que un sistema de generadores S de un 
espacio vectorial V es una base de V si S es minimal, esto es, al eliminar 
un elemento de S el conjunto resultante no genera Y. 


Observemos que las bases son sistemas de generadores óptimos en el sen- 
tido de que no sobra ni falta ningún elemento para generar el espacio. Por 
tanto es importante caracterizar en que casos una familia S de vectores de V 
es una base. Para ello necesitamos establecer el concepto de independencia 
lineal. 


Definición de independencia lineal. Una familia S de vectores de V es 
linealmente independiente si para cualquier subconjunto finito [v1, V2, ..., Vp} 
de S se cumple: 


A1V1 + A2V2 + .... + ÁApVp =0 => Az = No = bo0 == Ap = 


Una familia S de vectores linealmente independiente tambien se denomi- - + 
na libre. Si S no es linealmente independiente se dice que es linealmente | 
dependiente o ligado Veamos algunos ejemplos. E 
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3.4. Ejemplos. 


a) Si la familia está formada por un solo vector distinto de cero, S = {v} 
y v Æ 0, entonces es linealmente independiente ya que si Av = 0, necesaria- 
mente tiene que ser A = Q. 


b) La familia ((2, —1), (-1,3)) de R? es libre ya que 


2A=p=0 


A(2, 1) + (1,3) = (0,0) 1, 0 


=> AES 
en cambio la familia ((—1, —1), (3,3)) es ligada ya que 


=4+3p4=0 


sy + (3, 3) z (0,0) Z -À +34 = 0 


sistema que se cumple para infinitos valores de À y u, por ejemplo para à = 3 
yu=1 
c) De forma análoga al ejemplo anterior se razona que la familia 
MES 


de R? es linealmente independiente ya que 


A+t3u+v=0 
A(1, -1,2) + (3,2,1)+v(1,1,1) = (0,0,0) & -A+2u4+v=0 
2A+up+v=0 


y las únicas soluciones del sistema son A = =v =Q. 


d) La familia de polinomios (2,t,t? + 1,t% +t} es linealmente indepen- 
diente en el espacio P3(t) de los polinomios de grado menor o igual que tres, 
ya que si 


02 + Ait + A(t? + 1) + Alt? +t) = 0 
2A0 + A2 +(A1 + Ag)t + At? + Ag =0 


Igualando a cero los coeficientes del polinomio, se obtiene el sistema 


240 + A2 =0, Ar + A3=0, A2 = 0, àz = 0 
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cuya única solución es Ào = Ài = A2 = A3 = 0. 


Aplicando de nuevo la definición, es fácil comprobar que la familia 
CR A LE 


es linealmente dependiente. En efecto, si 


—Ao + Art + a a +8) =0 


e identificamos los coeficientes del polinomio con 0, resulta el sistema 


Ap = 0, A1— 42 = 0, 42 +44 =0, A3 +44 =0 


del que Ao = 0, à; = A2 = Az = 1,44 = —1. es una posible solución de las 
infinitas soluciones que tiene. 


e) Es muy sencillo razonar que la familia (€, 1%, 8%, .... 2H 0, } es libre 
y genera el subespacio de P(t) formado por los polinomios cuyos monomios 
son todos de grado impar. 


Observemos que si una familia de vectores S es linealmente dependien- 
te, alguno de sus vectores se puede poner como combinación lineal de los 
otros elementos de S por lo que podemos prescindir de él para generar el 
subespacio. Se llama rango del sistema S al número máximo de vectores 
linealmente independientes que posee. El sistema de generadores es finito si 
su rango es finito, y por tanto la base del subespacio que genera consta de 
un número finito de vectores. 


Caracterización de las bases. Un subconjunto de vectores B de V es 
una base de V si y solo si B es un sistema de generadores de V linealmente 
independiente. 


Demostración. Si B es una base, por definición, es un sistema de gene- 
radores. Veamos que es linealmente independiente. Si no lo fuera, existiría 
un subconjunto finito B; = [v;1, Vi2, ...., Vip) de B tal que sería linealmente 
dependiente, es decir, si 


A1Vi1 e A2 Vio TS A = 


existiría algún A, 4 0. Supongamos que es A, Æ 0, entonces 
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Via de 


y el sistema B no sería minimal, ya que podríamos prescindir de v;ı para 
generar V, lo que contradice la definición de base. 

Recíprocamente. Si B es un sistema de generadores linealmente inde- 
pendiente, entonces es un sistema de generadores en el que ninguno de sus 
vectores se puede poner como combinación lineal de los otros, es decir es un 
sistema minimal y por tanto una base. E] 


3.5. Ejemplos. 


a) El sistema ((1, 0), (0, 1)) es una base de R°. 
El sistema ((1, 0, 0), (0,1, 0), (0, 0, 1)) es una base de R*, 


En general, el sistema del Ejemplo 3.3 b) 


(e (Ob 0 a E Lal 


es una base de R”. Estas bases se denominan bases canónicas. 


b) El sistema {1, £, 2°, 23, n.a, Dd } es una base del espacio P(x). 


c) El sistema formado por las matrices de orden n x m en el que cada 
una de ellas tiene todos sus elementos 0 salvo uno de ellos en el que vale 1 
es una base de Mnxm. En particular, el sistema 


oo) (00): (30)Lo 1); 


es una base de Mazo. 


4. Espacios finitos. 


A partir de un sistema de generadores finito S = {v1, va,...., Vp} de un 
espacio V, siempre podemos obtener una base de V eliminando vectores 
innecesarios para generar el espacio. En efecto, si S no es una base, es decir 
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S es linealmente dependiente, existe un vector v; € S tal que es combinación 
lineal de los demás. Excluímos v; y consideramos el sistema S’ = S — {v;}. Si 
S' es linealmente independiente hemos acabado; si no lo es, existe un nuevo 
vector v; € S’ combinación lineal de los otros elementos de S’. Excluímos 
v; y consideramos el sistema S” = S' — [v;). Aplicamos repetidamente el 
proceso hasta encontrar un sistema linealmente independiente, esto es, una 
base B. 


Definición de espacio finito. Un espacio vectorial es finito si posee un 
sistema de generadores formado por un número finito de vectores o equiva- 
lentemente si posee una base finita. 


El siguiente resultado es esencial para conocer la estructura de un espacio 
de dimensión finita. En él se afirma que todas las bases de un espacio tienen 
el mismo número de elementos. Dado un sistema de vectores S designemos 
por G [S] al subespacio generado por S. 


Teorema de la base. Si A y B son dos bases cualesquiera de un espacio 
vectorial finito Y, entonces el número de vectores de A es igual al número 
de vectores de B. A este número se le denomina dimensión del espacto. 


Demostración. Sean 
A= {u May. Ue), Bi= {vi VI. Ve) 


y supongamos por ejemplo que m > n. 


La familia A; = fu, U2, ...., Un, V1} es linealmente dependiente ya que 
A es una base y vi tiene que ser necesariamente una combinación lineal de 
los elementos de A. Además A, genera el espacio V, es decir Y = G]|Aj]. 
Esto implica que existe un u; € A tal que u; es combinación lineal de 
los otros elementos de A,, pues en caso contrario A; sería una base. Como 
consecuencia 


Yy = G[A;] = G [Aj == Lu 
con lo que A; = A; — (u;1) es una base ya que sus vectores son linealmente 
independientes y generan el espacio . 
Sea ahora Ay = Aj U {v2}. Es claro que Az es una familia linealmente 


dependiente y como vı y va son linealmente independientes entre sí por ser 
elementos de B, necesariamente tiene que existir up € A — {un} tal que 
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uz € Ay — {un} y V=G [Az — {u2} . (Obsérvese que hemos repetido 
exactamente el proceso anterior). 


Consideramos a continuación la base Az = A; — {u2} . y la familia Az = 
A2U {v3}. Repetimos el proceso hasta completar n pasos y obtenemos una 
base A, que no contiene a ningún vector u; y está formada por los n primeros 
vectores de la base B, es decir An = ([vj, Va, ...., Vn}, como V = G [Ar], 
resulta que B no es una familia de generadores minimal lo que contradice la 
hipótesis de que era una base. Por tanto forzosamente ha de ser m < n. 


Si suponemos n > m y razonamos como antes, llegamos a que n < m. 
Concluimos que n = m. a 


El proceso en la demostración anterior, engorroso de escribir, es muy 
sencillo de comprender. En cada paso añadimos a la base A un vector de la 
base B y suprimimos uno de ella. Al cabo de n pasos solo tenemos en A (cuyo 
nombre hemos ido cambiando) n vectores de B que generan el espacio V y 
que son linealmente independientes por pertenecer a B. Ahora bien, como 
por hipótesis m > n, resulta que en B sobrarían vectores, lo que contradice 
que B sea una base. 


La primera consecuencia del teorema es que cualquier espacio vectorial Y 
de dimensión finita npuede identificarse con R”, para ello basta considerar 
que una base {v1,..., Vn} de V puede identificarse elemento a elemento con 
la base canónica de R”. 


R” — Yy 
(Li, Tn) > 1V1 +... + LnVn 


De este modo a cada vector de V le corresponde un único vector de R” y 
viceversa. Por tanto, desde ahora, y si no se dice lo contrario, al referirnos a 
un espacio de dimensión finita consideraremos que es R”. 


3.6. Ejemplos. 
a) De acuerdo con el teorema de la base, como la base canónica de R” 


tiene n elementos, el espacio es de dimensión n 


b) La base {1, x, x°, x°} del espacio de los polinomios P3(x) de grado 
menor o igual que tres tiene cuatro elementos, por tanto la dimensión de 
P3(x) es cuatro. 
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c) La base del espacio Mpxm del Ejemplo 3.5. b) tiene n.m elementos y 
el espacio es de dimensión n.m. En particular /M2x2 tiene dimensión cuatro. 


La, basch aa, rr } del espacio P(x) tiene infinitos ele- 
mentos y P(x) no es un espacio de dimensión finita. 


e) Consideremos el sistema de vectores de R’ 
S = [(-1,2,0), (3,0, —2), (1, 4, 2), (-2, —2,2)) 
y determinemos una base del subespacio que genera S. 


Desde luego S no puede ser una base de RÌ porque tiene cuatro vectores 
y sabemos por la base canónica que la dimensión del espacio es tres. Por 
tanto S es un sistema linealmente dependiente. Obtengamos a partir de él 
un sistema minimal, es decir un subconjunto S' de S con el mayor número 
posible de vectores linealmente independientes. 


Los vectores [(—1, 2, 0), (3, 0, —2)) son linealmente independientes ya que 
A 20 J (3,0, —2) T (0,0,0) >\= H= 0 


Si les añadimos el vector (1, 4, —2) y consideramos la combinación lineal 


AL 2, 0) A pL3, 0, 2) di E(1,4, 2) = (0, 0, 0) 


o lo que es equivalente 


=A+ 3u +E = 0, 24 +4 = 0, —2u — 26 = 0 
el sistema tiene infinitas soluciones, por ejemplo À = —2, u = —1, = 1. 


Por tanto los vectores son linealmente dependientes, con lo que podemos 
descartar el vector (1,4, —2). 


Si ahora les añadimos el vector (—2, —2, 2), de forma análoga 
A(—1, 2,0) + p(3, 0, —2) + £(=2, —2, 2) = (0,0,0) 
o lo que es equivalente 
=4 + 3u — 2 = 0, 21 — 2 = 0, —2u + 2E = 0 


el sistema tiene infinitas soluciones, por ejemplo A= u = E = 1 y podemos 


descartar también el vector (—2, —2, 2). 
Como consecuencia S' = {(—1, 2, 0), (3, 0, —2) } es una base del subespacio 
de dimensión dos que genera S. 
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4.1. Cambio de Base. 


Sea A = (u;,u»,...., Un} una base del espacio V. Cada vector v de V se 
puede poner de forma única como combinación lineal de los elementos de A 


V = UU)... + DAS 
A (z1, 72,23, ..., Tn) se le llama coordenadas de v respecto a A. 


El vector también lo podemos escribir de forma abreviada utilizando el 
signo sumatorio » >, es decir 


n 
v = X zili 
i=1 


Si B = {v1, va,...., Vn} es otra base de V, el vector v se representa de 
manera única en la base B por 


V=YiV1 + Y2Va +... + YnVn 


o mediante el sumatorio por 
n 
vE > YiVi 
¡=1 


Estudiemos como están relacionadas las coordenadas (21, £2, £3, ..., Zn) de 
v respecto de A y las coordenadas (y1, Ya, Y3, ---, Yn) de v respecto de B. Para 
ello tenemos que conocer las coordenadas (a3;, a24, ..., Ani) de cada vector u; 
de la base A respecto a los vectores de la base B. 


Supongamos entonces que la expresión de los vectores de la base A res- 
pecto a la base B es 


entonces se tiene que 
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M= ru] F eU FAA — 


n n n 
v = ) 01jTj | Vi + ) A | V2 F oe + ) anjili | Vn 


que se llaman ecuaciones del cambio de base, es decir del cambio de la 
base A a la base B. 


El cálculo matricial proporciona una herramienta sencilla para abordar 
el problema. Convenimos en que las coordenadas de los vectores se 
representan como matrices columna. Entonces las expresiones anteriores 
en forma matricial resultan 


yı 011 Q12 = +.» Qln Tı 
Ya 091 09 «1. +... 09%, T2 
Yn an1 n2 ... ... Ann Tn 


que se llama ecuación matricial del cambio de base de A a B. En forma 


abreviada escribimos Y = AX. Nótese que las columnas de la matriz A son 
las coordenadas de los vectores de A en la base B. 


Como la matriz A es regular, ya que en caso contrario los vectores de A 
serían linealmente dependientes y por tanto A no sería una base, para obtener 
las coordenadas X en función de las Y basta multiplicar por la inversa de A, 
es decir X = ATIY. La matriz B = A”? es la matriz del cambio de B a A. 


Naturalmente, si no se especifica lo contrario, es decir otra base, las co- 
ordenadas de un vector de R” se refieren siempre a la base canónica definida 
en el Ejemplo 3.5. a). 
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3.7. Ejemplo. 


a) Consideremos que A es la base canónica A = [(1,0), (0,1)) de R? y 
sea B = {(—1,2, ), (3, —2)) una nueva base (nótese que los vectores de B son 
linealmente independientes). Si las coordenadas de un vector respecto a A 
son (£1, £2) y respecto de B son (y1, y2), veamos la relación existente entre las 
coordenadas. Para ello tenemos que determinar previamente las coordenadas 
de los vectores de la base A respecto de los de la base B. 


(1, 0) = a (=1, 2) + azı (3, —2) = (-a11 + 3031, 2031 = 2a21) 
(0, 1) = ajo(—1, 2) + a22(3, —2) = (—a:2 + 3092, 2019 = 2492) 


De la primera expresión, obtenemos el sistema 


1 = —az: + 3091 A 1 de 1 

0 = 2a11 — 2a21 > 41 = 3,01 = 2 
De la segunda expresión, obtenemos el sistema 

0 = —a12 + 3022 3 x 1 

1 = 2a12 — 2092 >a: = e y 


Entonces se tiene 


n 
ii 
yı = X Qij£j = 011%] + 01221 = 771 + 722 


= 2 4 
E 1 1 
Y2 = > 0Q29jTj = 0917] + A2212 = 74 T 1” 


Por ejemplo, el vector (3, —4) en la base canónica tiene como coordenada 
(-3, 5) en la base B. 
La ecuación matricial del cambio de A a B es 


SE 


Nl= Nje 
Be Ael% 
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b) Utilicemos ahora el cálculo matricial. Dado el vector (£1, £2, 13) = 
(1,2, —1) en la base canónica A = {(1, 0, 0), (1, 0, 0), (0, 0, 1)}, calculemos sus 
coordenadas (y1, ya, y3) en la base B = ((1, 0, 2), (1,3, 1), (2, —1,0)). (Nótese 
que los vectores de B son linealmente independientes). Como la matriz de 
las coordenadas de los vectores de B en la base A (matriz del cambio cambio 
de B respecto de A) es 


ll 2 
e O A 
2 1 0 


entonces la matriz A del cambio de A a B es su inversa B7! = A 


—1 


de Fl 2 1 1 2 -—7 
A=| 03 -—1 = 733 -2 —4 1 
2 0 —6 1 3 
por tanto i 
z —ł2 
Yi 1 1 2 —7 1 13 
ya | = 733 —2 —4 1 2 J= 3 


c) Consideremos las bases B y B’ 


MOON LD 
B' = ar =2, 1); (2, = 1 (i 3, 1) 


Queremos encontrar las ecuaciones del cambio de base. Supongamos que 


(y1, Y2, ya) son las coordenadas de un vector en la base B y que (21, 22, 23) 
lo son en la base B’. Si efectuamos el cambio de coordenadas de un vector 
v en cada una de las bases B y B' a coordenadas en la base canónica A el 
resultado es el mismo y obtenemos la igualdad matricial 


—]1 0 1 Yi 1 2l 21 
0 1 1 Ya = 2 -1 3 22 
2 ASA Y3 1 1 1 Z3 


Obsérvese que la primera matriz es la matriz de cambio de B a A y que la 
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segunda es la matriz de cambio de B' a A. Para obtener unas coordenadas en 
función de las otras basta multiplicar por la correspondiente matriz inversa. 
Por ejemplo 


21 PARAR =1 0 1 Yi 
22 = =2 -1 3 M Ya 
z3 a 20% Ya 


Si (y1, ya, y3) = (4, 0, —1), sustituyendo y efectuando los productos, se tiene 


74 
21 -$ -i f -1 0 1 4 5 
PS PA o dle 0 |=] -12 
z3 -i 4 3 AO 1 s 


con lo que (21, 22, 23) = (74/5, —12, 31/5) 


De forma análoga, si quisieramos obtener las coordenadas Y en función 
de las Z multiplicaríamos por la inversa de la otra matriz. 


4.2. Ecuaciones de un subespacio. 


Veamos ahora que relaciones cumplen las coordenadas de los vectores de 
un subespacio propio. Sea V de dimensión n y S un sistema de vectores 
linealmente independientes 


S= {u;, Us Un! 


en donde m < n. El sistema S es una base del subespacio vectorial propio 


E de dimensión m que genera. Si las coordenadas de los vectores del sistema 
respecto a la base canónica de R” son 


uü; = (a11, 021) sidni ), Un = (a12, 022, Oz), “e Um = (Cims Uim O 


un vector cualquiera v = (£1, £2, L3,..., Zn) del subespacio E, es combinación 


lineal de los elementos de su base S con lo que 
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v = AU + A2U2 +... + Amiz 


o lo que es equivalente 


Tı 011 012 Aim 
T2 a21 a22 42m 
= A + A +... + A 
Ln Tni an2 Anm 


y resulta 


Tı = A1011 + À2012 +... + Amlim 
Ta = A1091 + A20992 +... + Amam 


Ln = Alani + À2an2 +... + Ámlnm 


que se denominan ecuaciones paramétricas del subespacio JE. Eliminando 
los parámetros A1, Az, Az, -.., Am obtenemos n — m ecuaciones 


birzi + bizta +... + Dia = 0 
ba1%1 + bata +... + boin£n = 0 


roo .ococnrrrrorncarorpnrossasoro..o.. 


On ma LI T On maa Fe + Din—m)jnTn =0 


que se llaman ecuaciones implícitas de E. 


2.8. Ejemplos 


a) El sistema ((2,—1)) de R? es evidentemente minimal y genera un 
subespacio propio E de dimensión 1. 


(z1, 22) = A(2, —1) 
Las ecuaciones parámetricas de E son 
Ti = ZA, Ta = =A 


Eliminando A la ecuación implicita resulta zı + 2x2 = 0, (recta que pasa por 
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el origen). 


b) El sistema {(2, —3, 0), (1, 1, 1)) es una base del subespacio E de dimen- 
sión dos que genera. Como 


(21, Ta, 23) = A1(2, —3, 0) E All, l, 1) 
sus ecuaciones parámetricas son 
T1 = 241 + Az, Tag = —3A1 + Az, T3 = Az 


Eliminando A; y Àz entre las tres ecuaciones resulta 31, +2x2— 5x3 = 0 que 
es la ecuación ímplicita de E, (plano que pasa por el origen). 
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Ejercicios y cuestiones propuestos 


1. Pruébese que el conjunto S de las sucesiones de números reales con 
las operaciones suma (an) + (bn) = (an + bn) y producto A(a,) = (Aan) por 
un número real A es un espacio vectorial. Determínense dos subespacios de 

S, +, x) y muéstrese una base de cada uno de ellos. 


2. Sean E, y Ep dos subespacios de un espacio V de dimensión finita n. 
Pruébese que E, N Ex es un subespacio de Y. 


3. Sean E, y Ez dos subespacios de un espacio Y de dimensión finita n. 

a) Razónese que E, U E2 genera E, + E2. 

b) Razónese que si E, N E2 = {0}, entonces cada vector v del subespacio 
E; + E) se escribe de manera única. (Es decir sólo existe un vector a € E; 
v un vector b € E, tales que v = a + b. Para ello supóngase que hay dos y 
pruébese que son iguales). 

c) Si E, N Ez = {0}, ¿cómo se encuentra una base de E, + Ez”, ¿cuál es 
su dimensión?. 

Nota. Si E, N E2 = {0}, el subespacio E, + Ez se llama suma directa 
de Ej y Es. 


4. Sean E, E2 y Ez subespacios de un espacio vectorial V. Estúdiese si 
son ciertas las siguientes igualdades: 


Er N (Es + Ez) = (E, N E2) + (E, N E3) 
Es + (E2 N E3) = (E, + E2) N (E + Ez) 


5. En el espacio vectorial de los polinomios (P(x), +, x) determínense tres 
subespacios de dimensión finita y tres subespacios de dimensión infinita. 


6. Estúdiese si el conjunto S = fx, 2x, x — x3, 1 — 2? — 25) es linealmente 


independiente. En caso contrario determínese un subsistema minimal S y 
dos subespacios del espacio Y que genere S’. 


7. Razónese por qué el subconjunto { (x1, £2, £3) € R? : 221 + 322 — 13 = 2) 
no es un subespacio de R. 


8. Determínese el rango del sistema 
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SMA ELO El 


¿Cuál es la dimensión del subespacio E que genera?. Obténgase una base de 
E diferente de la proporcionada por $. 


9. Dado el sistema 
S = {1, 0, L l, (au 0, L, =1), (1, il; l; t) (—1, l, 0, 1), (-1, 0, 1, —1)} 
de Rt, encuéntrese una base del subespacio que genera. 


10. Complétese el sistema S = {(—1, 1,0, 1), (-1,0,1,—1)) para obtener 
una base de Rt. 


11. Pruébese que el sistema B = ((—1,1,0), (1,0, 1), (0,1,1)) es una 
base de R*. Si (2, —1,4) son las coordenadas de un vector v respecto a la 
base B determínense las coordenadas de v respecto a la base canónica. 


12. Las coordenadas de v respecto a la base canónica de R? son (—2, 3, 0). 
Encuéntrense las coordenadas de v respecto a la base B del ejercicio anterior. 


13. Dados los sistemas 
A = [(1,1,0), (-1,0, 1), (0, —1,1))y B = ((-1,2,1), a 


a) Probar que A y B son bases de R. 


b) Dado el vector v de coordenadas (2, —3, 1) en la base A, encontrar sus 
coordenadas en la base B. 


c) Dado el vector w de coordenadas (2, —3, 1) en la base B, encontrar sus 
coordenadas en la base A. 


14. Determínense las ecuaciones paramétricas e implícitas del subespacio 
generado por S =((1,0,1,1), (-1,0,1,—D)P. 


15. Determínese una base y la dimensión del subespacio de R4 de ecuaciones 


2721 — £3 + z4 = 0 


—Tı — 222 + T3 — T4 = 0 
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16. Dado el sistema S = f(2, 0,1), (-1, 1,1), (0, 2,3), (-3, 1, 0), ). 
a) Determínese un sistema minimal S’. 


b) En caso de que S’ genere un subespacio propio E, encuéntrense 
las ecuaciones paramétricas de JE. 


c) Determínense las ecuaciones implícitas de JE. 


d) ¿Qué relación existe entre la dimensión del subespacio y el número 
de sus ecuaciones? 


17. Sean los subespacios 


ldi = S (21, 22, La, La) E€ Rt : 2x1 + 32 — T3 + Za = 0} 
E, = E La) Ww T T e 0} 


a) Determínense una base de E y una base de E). 

b) Determínense las ecuaciones del subespacio E; NE) y hállese una base. 
c) Determínense las ecuaciones del subespacio Ex +E y hállese una base. 
d) ¿Es E, + Ez una suma directa?. 


18. Sea E, el subespacio del ejercicio 15 y Ez el subespacio de ecuaciones 


11 — T2 +z4=0 
221 —2%3-24=0 
13+X14=0 


Determínese una base del subespacio E, N Ea. 


19. En R* se considera el subespacio E, definido por las ecuaciones 


Ly — T2-—Z4=0 


T3 — Ta = 0 
v el subespacio E> generado por el sistema 
S =((2,0,1,1), (21,0, 1, —1), (3,1,0, 1)). 


Determínese una base de cada uno de los subespacios E, + E> y E; N Ez. 
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20. Determínense las ecuaciones implícitas de los subespacios del ejercicio 
anterior. 


21. Las ecuaciones de un subespacio en la base 
B =$4«(1;0,0, 8:=1,2), (1,3, 104 


de R? son 


Yı + Y2 + Y3 = 0 
2yı — y3 = 0 


Determínense sus ecuaciones en la base canónica. 








Capítulo 4 
Aplicaciones lineales 


1. Introducción y objetivos. 


Como ya es conocido, una aplicación entre dos conjuntos A y B es una 
relación f : A —> B que a cada elemento x de A le hace corresponder un 
+lemento y = f(x) de B, al que se llama imagen de x por f. Si M es un 
subconjunto de B, al conjunto 


FM) = {zx € A: existe y € M tal que y = f (x))} 


<e le llama imagen inversa de M. Si un elemento y de B es a lo más imagen 
Je un único elemento de A, es decir si 


fu)=f(1) >:=x0 
«a aplicación se dice que es inyectiva. Si cada elemento de B es al menos ima- 
zen de un elemento de A, entonces se dice que es sobreyectiva. Una aplicación 


:nyectiva y sobreyectiva es biyectiva. 


Por otro lado, la palabra lineal procede de la función que asocia a cada 
número real z el número real f(x) = mx, en donde m es un número fijo, 
cuya gráfica es una línea recta que pasa por el origen. 


En este capítulo continuaremos con el estudio de los espacios vectoriales. 
Centraremos nuestra atención en las aplicaciones lineales f : Y — W entre 
Jos espacios vectoriales de dimensión finita Y y W, es decir, en aquellas 


T3 
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aplicaciones que conservan la estructura vectorial, o en otras palabras en 
aquellas aplicaciones cuya imagen f(V) es un subespacio vectorial de W. 


1.1 Objetivos. 


1. Reconocer las aplicaciones lineales entre dos espacios vectoriales y de- 
terminar el núcleo y la imagen. 


2. Conocer las distintas formas de definir una aplicación lineal entre es- 
pacios de dimensión finita y determinar las ecuaciones, dimensión y bases del 
núcleo y la imagen. 


3. Determinar el polinomio característico, los autovalores y los subespacios 
de vectores propios asociados a los autovalores de una aplicación lineal. 


4. Conocer la condición necesaria y suficiente para que una matriz P sea 
diagonalizable. En caso de ser P diagonalizable encontrar la matriz diagonal 
y la base a la que está referida. 


2. Aplicaciones lineales. 


Definición de aplicación lineal. Una aplicación f : Y — W es lineal 
si para todo u,v € Y y para todo A € R se cumple: 


a) f(u+v) = f(u) + f(v) 
A 


Es claro que las condiciones anteriores son equivalentes a 


f(u + uv) = àf (u) + uf (v) 


es decir, f transforma combinaciones lineales en combinaciones lineales, lo 


que equivale a decir que f transforma espacios vectoriales en espacios vecto- 
riales. 


Como consecuencia de la definición se tienen las siguiente propiedades. 
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Propiedades de las aplicaciones lineales. 


1. f(0) = 0. 
SIE 


3. Si E es un subespacio vectorial de Y, entonces 
f(E) = (f(w) € W: v eE) 


es un subespacio vectorial de W. 


4. Si E es un subespacio vectorial de W, entonces 
FUE) =[vEeV: f(v) eF) 


es un subespacio vectorial de V. 
5. Si Ay es un número real fijo, entonces Aof es una aplicación lineal. 


6. Si g es otra aplicación lineal de V a W, entonces f +g es tambien 
una aplicación lineal. 


7T. Si f:V=>W y g: W > Z son aplicaciones lineales, entonces su 
composición go f : Y > Z es una aplicación lineal. 


Demostración. Las demostraciones son muy sencillas y se dejan como 
ejercicio. A modo de ejemplo probemos la propiedad 4. 

Sean dos vectores arbitrarios u, uz € f”*(F), por tanto f (u1), f (u2) € F. 
Por ser F subespacio vectorial, cualquier combinación lineal de ellos Af (u1) + 
uf(u2) € F, y por ser f lineal f(Au + ua) € F, con lo cual Au, + uz € 
FF) y f- (F) es un subespacio vectorial de W. 


4.1. Ejemplos. 


a) La aplicación nula f(v) = 0 para todo v € Y es lineal. 


b) Si Y = W = R (los números reales considerados como espacio vectorial) 
y m € R un número fijo, la aplicación f : R — R definida por f(x) = mz es 
lineal. 


c) En el espacio vectorial P(x) de los polinomios, la aplicación que a 
cada polinomio p(x) le hace corresponder su derivada p'(x) es una aplicación 
lineal. (Recuédese que la derivada de una suma es la suma de las derivadas 
y que la derivada del producto por un número es el número por la derivada). 
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d) La aplicacion de R° en R? definida por f(z£1, £2, £3) = (—21,0, £2) es 
una aplicación lineal ya que por un lado 


J [A (z1, £2, 23) + elyi Ya, Ya)] = faz + LYI, Ata + Ya, AT3 + yz) = 
= (—Ax1 — Hyr, 0, Aza + ya) 


y por otro lado 


AF (ar, T2, T3) Si uÍ (Y, Ya, ys) = A=31, 0, 22) + (Y, 0, ya) 3 
= (—Ax1 — y, 0, Aza + ya) 


Además la imagen f(R*) = [(a,0,b) : a,b € R} es un subespacio vectorial, 
puesto que cualquier combinación lineal es de la misma forma y pertenece a 
F(RI) 

a(a,0,b) + B(c,0,d) = (aa + fc, 0, ab+ Bd) 


La dimensión del subespacio f(R*) es dos, ya que cualquiera de sus vec- 
tores es combinación lineal de los elementos de B = {(1, 0, 0), (0, 0,1)). Como 
B es linealmente independiente, B es una base de f(IR3). 


e) En el espacio vectorial S de las sucesiones de números reales (Ejercicio 
1, Capítulo 3) la aplicacion f : S —+S definida por f[(a,)] = (a2m+1) es 
lineal. En efecto 


f Alan) + u(bn)] = f [an + pbn)] = (Aang + pdan+1) 
Af [(an)] + uf [(bn)] = Aazn+1) + H(ban41) = (Adan+1 + Hbon+i) 


En general, obsérvese que si o : N > N es una aplicación creciente, 
entonces f [(an)] = (aom)) es una aplicacion lineal de S en S. 


f) Si C [0, 1] es el espacio vectorial de las funciones reales continuas en el 
intervalo (0, 1], la aplicación ® : C [0,1] + R definida por (f) = a Hx)jdx 
es una aplicación lineal. (Recuérdese que la integral de una suma es la suma 
de las integrales y que la integral del producto por un número es el número 
por la integral). 


Existen dos subespacios muy importantes asociados a una aplicación li- 
neal, el núcleo y la imagen, cuya utilidad veremos a continuación en el estudio 
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de los espacios de dimensión finita. Se llama núcleo de f y se denota por 
Ker f al subespacio f7*(0), es decir al subespacio de V tal que las imágenes 
de todos sus elementos por f es 0. Se llama imagen de f y se representa por 
Im f al subespacio f(V). Las siguientes propiedades nos permiten relacionar 
el caracter de f con la naturaleza de los dos subespacios. 


Proposición. Sea f : Y + W una aplicación lineal, se cumple: 

1. f es inyectiva si y sólo si Ker f = {0}. 

Demostración. Sea f inyectiva. Como f (0) = {0}, si f(v) = 0, necesaria- 
mente ha de ser v = 0. Recíprocamente. Sean v, u dos vectores cualesquiera 
de V, como por hipótesis Ker f = {0} , es decir, si f(z) = O entonces z = 0, 
resulta 

Fw =flu) > fiv—-u)=0=>v-u=0>v=u 


2. Si f es inyectiva y S C V es una familia linealmente independiente, 
entonces f(S) es una familia linealmente independiente en W. 


Demostración. Sea S = {v1, V2, ..., Vp} un subconjunto de vectores lineal- 
mente independiente de V. Consideremos una combinación lineal 


Af (vı) + Aaf (va) P oodi Apf (Vp) =0 


de elementos de f (S). Por ser f lineal 


f (Aivi +A2V2 +... + ÀpVp) = 0 
y como f es inyectiva, se tiene 
A1V1 + A2 Va ar ApVp —Y 


con lo cual Ay = A2 = ... = Ap = 0 ya que {v1, V2, ..., Vp} son linealmente 
independientes. 


3. Si f es inyectiva y S C V es una base, entonces f(S) es una base del 
espacio imagen f(V). 


Demostración. Es una consecuencia inmediata de la propiedad anterior. 


4.2. Ejemplos. 
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a) Sea Ps(x) el espacio de los polinomios de grado menor o igual que cinco. 
El núcleo de la aplicación lineal f que a cada polinomio p(x) del espacio P5(x) 
le hace corresponder su derivada p'(x) es el conjunto de los polinomios de 
grado cero, es decir de los polinomios constantes, ya que son los únicos que 
tienen su derivada cero. En otras palabras Ker f = R (nótese que R es un 
subespacio de Ps(x)) y como consecuencia f no es inyectiva. Es claro que el 
subespacio imagen son todos los polinomios P4(1) de grado menor o igual 
que cuatro. 


b) El núcleo de la aplicación f de R? en R° definida por f(z£1, £2, 13) = 
(—x1,0, £2) es Ker f = ([(0,0,a) € R?} ya que los elementos de este sub- 
espacio son los únicos que cumplen f(x1,12,73) = (0,0,0). El subespacio 
Im f ha sido estudiado en el Ejemplo 4.1. d). Nótese que la imagen por f 
de la base canónica de R es el sistema [(—1, 0, 0), (0,0, 1), (0,0,0)), y que 
[(-1, 0, 0), (0,0, 1)) es una base de Im f. 


c) El núcleo de la aplicación f de R? en R* definida por f(x1, £2) = 
(—x21, —22, 0) es Ker f = [(0,0,0)) ya que 


ama) = Fur, ya) = (=x1, —22, 0) z= (y, —ya, 0) = 11 = Y1, T2 = Ya 


y f es inyectiva. El subespacio Im f es {(À, 1, 0) € R*) y la imagen por f de 


la base canónica {(1, 0), (0,1)} de R? es una base {(—1, 0, 0), (0, —1,0)) de 
Im f. 


3. Aplicaciones lineales entre espacios de di- 
mensión finita. 


Consideramos en todo lo que sigue un espacio vectorial V de dimensión 
n y un espacio vectorial W de dimensión m. Sea B = (v;,Va,..., Vn} una 
base de V y B' = {w1, W2, ..., Wm} una base de W. Una aplicación lineal 
f : Y => W queda determinada si conocemos las imágenes de los elementos 
de la base B en función de los elementos de la base B’, es decir, si conocemos 
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F(v1) = Q11W1 + 092 Wo +... + Ami Wm 
f(v2) = 412W1 + a22W2 +.... + am2Wm 


F(Vn) = lin W1 + 02 Wa +... + An Win 


En efecto, cualquier vector v € V es una combinación lineal de los elementos 


de la base B, esto es v = );_, 2¿v;, con lo que su imagen viene dada por 


Como consecuencia, si f(v) = y¡W, + Y2Wa + .... + YmWm, se tiene Yj = 


X; 2,05, cuya expresión matricial es 


Yı üm Gia ee r l Un Ti 
Ya 091 1092 .. .... 0Q9mn Ta 
Um Am1 Am2 .... e... Amn Tn 


que de manera abreviada podemos escribir Y = AX. La matriz A € Mmxn 


se llama matriz de la aplicación lineal. (Obsérvese que los vectores columna 
de la matriz A son las coordenadas de las imágenes de los vectores de la base 
B respecto de B’). 


En particular, si Y = W y la matriz asociada a f es regular, la aplicación f 
define un cambio de base. Y recíprocamente, todo cambio de base lo podemos 
considerar como una aplicación lineal biyectiva de Y en sí mismo que a cada 
elemento de una base le asigna uno de la otra base. 


Si el espacio W es R la aplicación lineal suele llamarse forma lineal. 


4.3. Ejemplos. 
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a) Supongamos en V = R? y W = R? con sus bases canónicas y deter- 
minemos f(2,—3), en donde f está definida por 


f(1,0) = (2, —2,1), f(0,1) = (0,1,4) 


La matriz asociada a la aplicación es 


por tanto 


Yı 2 0 9 4 
Y |=| a 1 ( 23 ) = y 
1 4 —10 


b) En el Ejemplo 4.2. b) se considera la base canónica tanto en el espacio 
inicial como en el final. La matriz de la aplicación f de R3 en R? es 


Como consecuencia la expresión matricial de las coordenadas de f(v) viene 


dada por 
Yi -100 Tı —2] 
Ya = 0.0.0 T2 = 0 
Y3 0 1 0 T3 T2 


Obsérvese que A no es regular y por tanto no es la matriz de un cambio 
de base. La dimensión de f (R°) vimos que era dos. 


c) Dado un espacio V = W = R” y dos bases B y B’, ya hemos comentado 
que el cambio de base puede considerarse como una aplicación lineal. La 
matriz asociada a f es la matriz de cambio de base de B a B’ y viene 
determinada por las coordenadas de los vectores de B respecto de los vectores 
de B’. 
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Sea V = W = R? y para mayor claridad supongamos V con la base B = 
£(1,0, 0), (0, 1,0), (0,0, 1)) y W con la base B' = ((1, —2, 1), (2, —1, aL). 
Las coordenadas de los vectores en la base B las designamos por (11, £2, £3) 
y en la base B' por (y1, Ya, Y3). 


i) Consideremos el vector (y1, Ya, Y3) = (3,—2,4) y calculemos sus 
coordenadas en la base B. Si la matriz de las coordenadas de los vectores de 
B’ en función de los vectores de B es 


TT 2 1 
B'= | -2 —1 3 
1 l Al 
resulta 
T2 = —2 -1 3 —2 = 8 


Pues bien, este cambio de base lo podemos considera como una aplicación 
lineal biyectiva f de W = V en V con la base canónica tanto en el espacio 
inicial como en el final (que es el mismo). 


ii) Supongamos el vector v = (21,12,13) = (3,—2,0) y calculemos sus 
coordenadas en la base B’. La matriz B de las coordenadas de los vectores 
de B en función de los vectores de B’ es la inversa de la matriz de B’ de i) 


le o 2 I 1 4 -1 7 
B=| -213] =¿| 5 0-5 
ds ¿li dl —1 Po: 
por tanto las coordenadas (y1, Y2, Ya) de v son 
Y Y a 3 cad) 
w = 5 5 0 (3 =2 |= 3 


Análogamente al caso i), podemos considerar que se trata de una aplicación 


lineal biyectiva g de V en W = Y cuya matriz es B. Obsérvese que f y g son 
aplicaciones inversas, es decir g = f~}. 
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Recordemos que el núcleo de la aplicación lineal, Ker f, es el conjunto de 
vectores de V que cumplen la ecuación matricial AX = O y la imagen, Im f, 
es el conjunto de los vectores de W que cumplen la ecuación Y = AX. Por 
abuso de lenguaje a Ker f también se le llama núcleo de la matriz A. 


4.4. Ejemplo. 


Determinemos el núcleo y la imagen de la aplicación de R3 en R*, con sus 
bases canónicas, definida por la ecuación 


yı il 2 0 

pIa 1 24 ka 
Y3 y =3 -1 -1 2 
Ya A E E 


1 2 0 0 11 +2x2=0 
Ore] Ma D ll 211 + T2 — T3 = 0 
SE ES a Me 23 0 
pang Ve : 0 dx, — 2z + 2£3 = 0 


o equivalentemente, prescindiendo de las ecuaciones que son combinación 
lineal de las otras 


21 + 229 =0, —221 +x22-3=0 


Como las soluciones de las ecuaciones son de la forma (—2A, À, 5A), resulta 
que 

Ker f =([(-2A,A,5A4) : A € R} 
con lo que su dimensión es uno y una base es el vector [(—2, 1, 5)). 


Las ecuaciones parámetricas de Im f son las ecuaciones de la aplicación 


Y I Q e 1020 
a E A B y 20 O 
Y3 =O Y ys =—-3a -fp -y 


Ya 4-2 2 ya = 4a — 26 + 2y 
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en donde, para facilitar la notación hemos cambiado 21,Y2,T3 por unos 


parámetros a, B,y. Si eliminamos los parámetros (por ejemplo aplicando el 
método de reducción), obtenemos las ecuaciones implícitas de Im f 


Y — Ya +HYg=0, 2y1 + 2y3 + ya =0 


Como la ecuación matricial anterior es equivalente a 


Yı 1 2 0 
Ya S —2 1 —1 
Y3 T” —3 j B —1 an —1 
Ya 4 —2 2 


Im f esta generado por el sistema que forman los vectores columna de la ma- 


triz, cuyo rango es dos (rango de la matriz), por tanto, Im f tiene dimensión 
dos y una base está formada por los dos primeros vectores columna de la 
matriz. 


3.1. Matrices equivalentes. 


La existencia de distintas bases en los espacios nos introduce una nueva 
cuestión. Sea P € Mmxn la matriz asociada a una aplicación lineal f entre 
el espacio vectorial Y de dimensión n y base A y el espacio vectorial W de 
dimensión m y base B. Consideraremos dos nuevas bases A’ en V y B’ en 
W. Sea Q € Mmxn la matriz asociada a f en estas bases, cabe preguntarse 
si existe alguna relación entre las matrices P y Q. La repuesta es afirmativa, 
veámosla. 


Sea A € Mn la matriz del cambio de la base A a la base A’ en el espacio 
Y, cuya ecuación es X’ = AX, en donde X son las coordenadas del vector 
en la base A y X’ en la base A”. 


Análogamente, sea B € Mm la matriz del cambio de la base B a la 
base B’ en el espacio W, cuya ecuación es Y” = BY, en donde Y son las 
coordenadas del vector en la base B e Y’ las coordenadas en la base B’. 


Las ecuaciones de la aplicación lineal en las bases anteriores son 
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Vii. Y == 0 
Teniendo en cuenta los cambios de base, sustituimos en la segunda ecuación 
Y’ = BY y X' = AX , con lo cual 
BYSAAK e VBA 


y como P es la matriz asociada a f en las bases A y B, necesariamente tiene 


que ser igual a B*QA, es decir 


P= BQA 





Las matrices P y Q se dice que son equivalentes. Esto nos lleva a la siguiente 


definición general. 


Definición de matrices equivalentes.Dos matrices P,Q € Mmxn se 
llaman equivalentes o semejantes si existen dos matrices regulares A € Mn 
y B € Mm tales que P = B7QA. 


4.5. Ejemplo. 


Sea la aplicación lineal f de V = R? y W = R? con sus respectivas bases 
canónicas A y B, y sea P la matriz asociada a f 


2 0 
ES | 2 l 
1 4 


Consideremos en R? la base A’ = {(1,2),(1,—1)} y en R3 la base B' = 


{(—1, 1,2), (0, —1,1), (1,3,0)}. Determinemos la matriz asociada a f en las 
nuevas bases. 


La matriz A del cambio de la base canónica A a A'es 


zi 
LAA nw oe 
aa J y por tanto A (> E) 


y la matriz B del cambio de la base canónica B a B'es 
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=m on —3 11 

B= 1-13 = 6 —2 4 

2 10 Sa ll 


como y P = B7*QA, entonces Q = BPA”!, y se tiene 


1 
AA 2 0 ea 3 —2 
ae m -2 1 >, e 
3. 1 e 1 4 2 0 


En particular, sea V = W y sea P la matriz de la aplicación lineal f de V 
en V referida a una determinada base A. Si B es una nueva base, la matriz 
Q asociada a f en la base B viene dada por Q = A7*PA, en donde A es la 
matriz del cambio de base, es decir la matriz de los vectores de A en función 
de los vectores de B. 


3.2. Rango de una aplicación lineal. 


Sea f : V — W una aplicación lineal. Estudiemos que relación existe 
entre la dimensión n de V y las dimensiones de Ker f y de Im f. Supongamos 
que Ker f 4 {0} y que {v1, V2, ..., Vp} es una base de Ker f, de modo que 
su dimensión es p < n. Si completamos la base añadiendo un conjunto S de 


n — p vectores, S = [Vp+1, Vp+2) -»», Vn} , de forma que 


B = [Vo+1) Vp+2> Lo... s Vn; V1, V2, c.c.. Sp 


sea una base de V, los vectores de la imagen 


generan el espacio imagen f(V) = Im f (los vectores v1, V2, ....., Vp pertenecen 
a Ker f y sus imágenes son 0), pero además f(S) es un sistema linalmente 
independiente y por tanto una base de Im f . En efecto, si consideramos una 
combinación lineal 


Apti (Vp41) + Apr2 8 (Vp+2) +- + Anf (Vn) = 0 
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o lo que es equivalente 


Jma + Ap+2Vp+2 F soea I Anda) =0 


entonces Ap+1Vp+1 + Ap+2Vp+2 + ---- + An Vn € Ker f, y por tanto tiene que ser 


una combinación lineal de los elementos de su base, es decir 


Ap+1Vp+1 + Ap+2Vp+2 +... + AN = A1V1 + A2 Vo +... + ApVp 


Ahora bien, B es una base de V y la expresión anterior equivale a una com- 


binación lineal de elementos de B igualada a 0, y necesariamente todos los 
escalares tienen que ser cero, y en particular Apy1 = Apy2 = «--- = An =0. 


Como consecuencia, una base de V está formada por los vectores de una 
base del núcleo y un número igual de vectores que el de una base de la imagen 
de f. En resumen, hemos demostrado el siguiente resultado que se conoce 
con el nombre de Teorema de la dimensión 


dim V = dim Ker f + dim Im f 


Obsérvese que si Ker f = {0}, entonces dim Ker f = 0 y la aplicación f 
es inyectiva ya que dim Im f = dim Y = n. 


Completemos ahora los n—p vectores de la base f(S) de Im f con w1, wa, 
..., Wm-—(n—p) Vectores para obtener una base B’ de W, 


y determinemos la matriz de la aplicación f respecto a las bases B de V 


y a la base B' de W. Para ello necesitamos conocer las coordenadas de los 
vectores de f(v), imágenes de los vectores de vg € B, en B’ Como 


f(v;) = f(vx) parap+1<k<n 
Fiv;) =0 paral<k<p 


ya que en el último caso vy € Ker f, las coordenadas de los vectores f(vz), 
con p +1 < k < n, son todas 0 salvo la que ocupa el lugar k que es 1 y las 
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coordenadas de los vectores f(v;), con 1 < k < p son todas 0. Considerando 
como siempre columnas las coordenadas de los vectores, la matriz viene dada 


por 
loa ( C — Oim—»)x(m=tn=p)) ) 
Opxn-p  Upx(m-(n-p)) 
en donde In-p es una submatriz unidad de orden n — p y el resto son sub- 


matrices de ceros cuyas dimensiones son las que se indican. (Recuérdese que 
dimW =m ) 


Se llama rango de la aplicación lineal f al número n — p, es decir, a 
la dimensión del espacio Im f. Es evidente que este número es el de vectores 
columna linealmente independientes de la matriz R y coincide a su vez con el 
rango de de la matriz R (orden del mayor menor no nulo, el cual corresponde 
a la submatriz In-p). 


Recordemos que, fijadas las bases A y B de los espacios, una matriz 
cualquiera de orden m x n define una aplicación lineal f de V en W por 
medio de f(X) = PX, en donde P € Mmxn y X es un vector columna que 
representa las coordenadas del vector en la base A de V. Como el espacio 
imagen f(V) está generado por el sistema formado por los vectores columna 
de la matriz P, su dimensión n — p coincide con el número de vectores lineal- 
mente independientes del sistema (rango del sistema), o lo que es igual con el 
número de columnas linealmente independientes de la matriz. Por otra parte 
es claro que si en la notación matricial hubiésemos considerado vectores filas 
en vez de columnas, siguiendo un proceso análogo al realizado hasta aquí, se 
tendría que el número de filas linealmente independientes es también n — p. 


En resumen: el rango de una aplicación lineal es el de su matriz asociada 
y coincide con el número de sus columnas o filas linealmente independientes. 


4.6. Ejemplos. 


a) Determinemos el rango de la aplicación lineal f : R? — Rt, cuya matriz 
asociada es 


TP Ore T mo] 
L = e 
S a =2 $8 
6 MM == 12 
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Obsérvese que la tercera fila es la suma de la primera más la segunda 
multiplicada por 2, por lo que todos los menores de orden cuatro son nulos. 
Como 


IP 
0 -3 3|=3 
0 0 -l1 


el rango es de la matriz es tres. Entonces dim Im f = 3 y dim Ker f = 2. 


b) Una vez conocido el Teorema de la dimensión, el Ejemplo 4.4. se razona 
de forma más sencilla. En efecto, como dim Ker f = 1, entonces dim Im f = 2 
y una base de Im f la constituyen dos vectores columna cualesquiera lineal- 
mente independientes de la matriz. 


c) Dada la matriz 


—1 

0 
-1 
=í 


O N e me 
o ao N = 
21 he 


asociada a una aplicación lineal f de R* en Rt con las bases canónicas, 
estudiemos los espacios Ker f e Im f. 

El rango de la matriz es dos (compruébese), por tanto dim Im f = 2 y 
dim Ker f =4-2=2. 

Una base de Im f está formada por dos vectores columna linealmente 
independientes cualesquiera, por ejemplo {(1, 1, 2, 3), (—1, 0, —1, —1)}. Como 


(yi, Y2, Y3, Ya) = A(1, i, 2; 3) Ap AE 0, = —1) 


unas ecuaciones paramétricas de Im f son 


yı =A=p, Y2 = À, Ya =2A4— y, Ya = 3A —p 


y eliminando los parámetros resultan las ecuaciones implícitas 


Yı + Y2 — Y3 = l, Yı + 2y2 — Ya = 0 
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Las ecuaciones de Ker f son 


1 —1 1 —1 Tı 0 Tı — T2 + T3 — T4 = Q 
1 0 2 1 La had 0 tes zı +223 + 24=0 
rl S 0 T3 0 221 — T2 + 323 =0 
3 5 1 T4 0 321 — T2 + 0123 + T4 = 0 


o equivalentemente (suprimiendo las dos últimas que son combinación de 
ellas ) 


T1 — T2 + T3 — T4 = 0, £1 + 2z3 + z4 =Q 


Una base la forman dos vectores linealmente independientes cualesquiera que 


cumplan las ecuaciones, por ejemplo {(—2, —1, 1,0), (—1, —2, 0, 1)}. 


4. Valores y vectores propios. 


Consideramos ahora aplicaciones lineales de un espacio vectorial V, de 
dimensión n, en si mismo. Fijada una base A en V y una aplicación lineal f 
de V en V, determinada por la matriz A, vamos a estudiar en que condiciones 
podemos asociar a f una matriz diagonal D equivalente a A, y en su caso, la 
base B de V a la que está referida D. Para ello establecemos los conceptos 
de valor y vector propio. 


Definición de valor y vector propio. Un número A € R se llama 
valor propio o autovalor de f si existe un vector v 4 O tal que f(v) = Av. 
Al vector v se le denomina vector propio o autovector de f asociado a A. 


Los conceptos anteriores son válidos cualquiera que sea la dimensión del 
espacio V, y la aplicación lineal f : V —> V. Sin embargo, nos referiremos 
siempre a espacios de dimensión finita. Por otra parte, la definición no ex- 
cluye el valor A = 0 para el que f(v) = O y v % 9 pertenece al núcleo. 
Recíprocamente, todo vector del núcleo v 4 O es propio y corresponde al 
autovalor A = 0. 
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Si utilizamos el lenguaje matricial, y A es la matriz de f referida a la base 
A de la definición dada, resulta que AX = AX o lo que es equivalente 


ALAN DO 


en donde / es la matriz unidad de orden n. Como los vectores propios son dis- 
tintos de cero, X 4 (0), la matriz (A — AI) no puede ser regular pues en caso 
contrario, multiplicando por su inversa los dos miembros de la igualdad ante- 
rior, obtendríamos X = 0. Por tanto (A — AI) es singular y su determinante 
tiene que ser cero, es decir 

|A=AT|=0 
La expresión anterior es una ecuación en A, cuyas soluciones son los autova- 


lores de f, y se conoce con el nombre de ecuación de los autovalores o 
ecuacion característica. 


Para calcular los vectores propios, correspondientes a un determinado 
valor propio Ap, tenemos que resolver el sistema 


AX =»X & (A-AoI)X =0 


y las soluciones de este sistema constituyen el núcleo de la aplicación lineal 
definida por la matriz A— Ap/, que no se puede reducir al vector cero porque 
|A — AI| = 0 y el rango de A— Ao] es estrictamente menor que n. Al núcleo 
de la aplicación lineal definida por A — ào se le denomina subespacio 
propio asociado a Ap. Por abuso de lenguaje llamaremos también núcleo 
de la matriz A — Ag] al de la aplicación lineal que define. 


A los valores y vectores propios de f, también se les suele llamar valores 
y vectores propios de la matriz A y a det(A — AZ) polinomio carac- 
terístico. Para una mejor comprensión vamos a repetir el proceso anterior 
en el ejemplo siguiente. 


4.7. Ejemplo. 


Consideramos en R? la base canónica y sea f : R? —> R? la aplicación 


definida por 
1 4 
4= (52) 
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De acuerdo con la definición tenemos AX = AX 


PINO 


o lo que es equivalente( A — AN)X = 0, en donde I es la matriz unidad de 
orden 2, es decir 


(52) 201) ()- E 25)(5)-(4) 


Como por definición X # (0), no puede existir 


PA 4 e 
ii 


ya que si existiese, multiplicando la igualdad por ella 


EN e ds de 0 
3  2-A 3 2-A a 3 2-A 0 
1 0 Tı > 0 
0 1 T2 de 0 
por tanto la matriz A — A/ es singular, con lo que 
a-an=| 53 4 


Y 2_ 2110 
3 e 3A—-10=0 


entonces el polinomio característico es A2— 3A — 10 y sus ES es decir, 
los valores propios son —2 y 5. 


Para calcular los vectores propios, de acuerdo con la definición, tenemos 
que resolver el sistema 


PESE O 


Entonces, para À = —2 
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3 4 £ı "i 0 d 
K A S y 


luego cualquier vector de la forma (—¿za, 12) con 12 Æ 0 es un vector propio 


para el autovalor —2, o en otras palabras todos los vectores del subespacio 
E de ecuación 311 + 4x2 = 0 son vectores propios para A = —2. Por ejemplo 
(-$,1) . AE se le llama subespacio propio asociado al autovalor À = —2. 


Análogamente para À = 5 


3) ()=(0)+.-2-0 


y el subespacio propio asociado a À = 5 tiene de ecuación zı — 22 = 0. Por 
ejemplo (1,1) es un vector propio. 

Si el polinomio característico tiene alguna o todas sus soluciones imagina- 
rias, es claro que la matriz no puede tener todos sus autovalores reales. Por 
otro lado, después de los ejemplos, probaremos que si el valor propio À es 


una solución múltiple del polinomio característico, su multiplicidad es mayor 
o igual que la dimensión de su espacio asociado. 


Una vez más, recordemos que las coordenadas (x1, Z2,..., 14) de los vec- 
tores que intervienen en un cálculo matricial convenimos en representarlas 
por matrices columnas. 


4.8. Ejemplos. 
a) La matriz 


(13) 


no tiene autovalores reales ya que su polinomio característico A? — 2A +7 no 


tiene soluciones reales. 


b) El polinomio característico de la matriz 


TE 


es (A— 1)? y À = 1 es un valor propio de multiplicidad dos, sin embargo el 
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subespacio asociado JE tiene dimensión uno, ya que 


E 


y una base de E es el vector ((1, 0)). 


c) El polinomio característico de la matriz 


la SA —12 
A= 38 10 24 
8&8 1 9 


es Aé — 61? — 9A + 54, y sus autovalores son 6, 3, —3. 


Las ecuaciones del subespacio Ey asociado a à = 6 son (A — 6/)X =0, 
esto es 


me e a L —19x, — 2x2 — 12z3 = 0 
e E A 811 + T2 + 323 = 0 
So 3 T3 0 pu idi 


cuya dimensión es uno, ya que el rango de la matriz A — 6/ es dos. Una base 
de E; es {(—2, 13, 1)). 

Las ecuaciones del subespacio Ez asociado a à = 3 son (A — 3I)X = 0, 
esto es 


z: E E ne s 1 A —16x71, — 2z — 1223 = 0 
á 5 — 
8 1 6 T3 0 38x1 + Tr + 24x3 = 0 


cuya dimensión también es uno, ya que el rango de la matriz A — 31 es dos. 
Una base de Ez es {(—1, 2, 1)). 


Finalmente, las ecuaciones del subespacio Ez asociado a à = —3 es (A + 
3I)X = 0, esto es 


T ee eL 0 Eoen 1 fFúW0 
38 13 A va e A, ora 
EA T3 0 Vi Lag 


y dim E3 = 1, base de Ez = {(—2, 4, 1)} 
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d) El polinomio característico de la matriz 


ESRT, 
A=| 3 3 6 
2 2 4 
es 
1=A -1 2 
3 -3-0 œ =D = A A=2) 
2 2 4-A 


por tanto sus valores propios son A; = Àz = 0 (doble), y Az = 2. Las ecua- 
ciones del subespacio E asociado al autovalor O son 


1 —1 2 Tı 0 
3 —3 6 Ta = 0 > 11 — 12+213=0 
2 2 4 T3 0 


la dimensión E, es dos y una base {(1, 1,0), (-2,0,1)). (Obsérvese que la 


matriz A — OI = A tiene rango uno, pues todos sus menores de orden dos 
son 0 , ya que las filas dos y tres son iguales a la fila uno multiplicada 
respectivamente por 3 y 2. 


Las ecuaciones del subespacio Es asociado al autovalor 2 son 


dE 21 0 
PE o Mha E E HP 
2 ¿Y A T3 0 q 


su dimensión es uno y una base es [(1, 3, 2)}. (Obsérvese que la matriz A—21/ 
tiene rango dos). 


Como el polinomio característico de una matriz A y el de una matriz 
equivalente a ella A’ = PAP”? son iguales, entonces, teniendo en cuenta que 


det P=* = 5, resulta 


det(A — AI) = det(PAP”* — AL) = det P(A— AL)P"* = 
= det P det(A — AL) det P? = det(A — AI) 
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entonces los autovalores de la matriz A que determina f en una base A de V 
son idénticos a los de la matriz A” que determine a f en otra base A”, puesto 
que ambas matrices son equivalentes. Por lo tanto el polinomio característico 
y los autovalores son invariantes, es decir, son los mismos para todas las 
matrices equivalentes. A la matriz P también se le suele llamar matriz de 
paso. 


En resumen, dado un autovalor A el subespacio E de vectores propios 
asociado es el núcleo de la aplicación lineal definida por la matriz A — ÀI y 
por tanto su dimensión es 


p =n — rango(A — Al), 


pues la dimensión del espacio imagen por A— AI es el rango de A — Al. 
Además como el rango es invariante para cualquier cambio de base, tampoco 
varían las dimensiones de los subespacios asociados. 


En el Ejemplo 4.7. b) el valor propio A = 1 era doble, sin embargo la 
dimensión de su subespacio asociado era uno. En general, la multiplicidad 
del valor propio es mayor o igual que la dimensión del subespacio. 


Relación entre la multiplicidad y la dimensión. Si un autovalor Ay 
es múltiple de orden q, su subespacio asociado E es de dimensión p < q. 


Demostración. Sea {v1, va,..., Vp} una base del núcleo de A — Ap/, es 
decir del subespacio E asociado a Ap, si la completamos hasta obtener una 
base {v1, Va, ..., Vp, Vp+1) --»» Vn} del espacio V, como las coordenadas de las 
imágenes 


f(v1) = Aova, $ (va) = AoV2, aa F(Vp) = AoVp» r), e (Un) 


son las columnas de la matriz que determina la aplicación f en la nueva base, 


la matriz B equivalente a A es de la forma 
BD Í Aolp Mbx(n—p) ) 
On—p)xp Nin-p)x(n—p) 


en donde son claros los órdenes de las submatrices. Por tanto, como el poli- 


nomio característico de la nueva matriz B es el mismo que el de la matriz 
inicial A, y 
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det(B — Al.) = (Ao — AJPdet(N — Alp) 


pues det(Aol, — Alp) = (Ao — A)”. Entonces resulta que Ay es al menos una 


raíz de multiplicidad p de det(A — Af, ) = 0, con lo que p <q. O 
4.9. Ejemplos. 


a) Las matrices 
le UY 2 00 
A=| -1 1 2 == WM 0 al 
O 2 0 0 1 


son equivalentes, ya que A = QBQ”?, siendo la matriz de paso Q 


AAA 
0 =1| a ca 
ll dice 


Los polinomios característicos de A y B son iguales, esto es 


det(A — AL) = det(B- AI) = (1-M*(2-A) 


b) Los autovalores de las matrices A y B son A = 1 con multiplicidad 
q=2y A=2 con multiplicidad q = 1. Como el rango de las matrices A — I 
y B — I es dos, la dimensión del subespacio asociado a À = 1 es p = 1 y 
por tanto p < q. (Recuérdese el teorema de la dimensión y que el rango de 
la matriz A — I es la dimensión del subespacio imagen). Análogamente la 
dimensión del subespacio asociado a À = 2 es p = 1 y por tanto p = q. 


c) Las ecuaciones del subespacio asociado al autovalor A = 1 del ejemplo 
anterior son —21+2x3 = 0, 2,+13 = 0 y una base es {(0, 1, 0)}. Las ecuaciones 
del subespacio asociado al autovalor A = 2 son 12 = 23 = 0 y una base es 
[(1, 0,0)). Es claro que los vectores propios (0, 1, 0) y (1, 0, 0) son linealmente 
independientes, pero no constituyen una base de R. 
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5. Matrices diagonizables. 


El interés de esta sección se centra en establecer las condiciones que debe 
de cumplir una aplicación lineal f, de un espacio V de dimensión n en si 
mismo, para que pueda determinarse una nueva base de V en la cual f se 
defina mediante una matriz diagonal D. En caso de que sea posible, se trata 
de obtener D a partir de la matriz inicial A. Tendríamos así la forma más 
sencilla de representar a f. 


Una cuestión previa, necesaria para estudiar las condiciones mencionadas, 
es el siguiente resultado sobre la independencia lineal de los vectores propios 
asociados a autovalores distintos. 


Independencia lineal de los vectores propios. Si [A1,Az,..., Ax) son 
autovalores distintos, A; % Aj para todo i 4 j, entonces cualquier familia de 
vectores propios asociados [v;, V2, ..., Vx) es linealmente independiente. 


Demostración. Supongamos que {v1, Va, ..., Vp} son linealmente dependi- 
entes y existen Q1, %,..., Œk Números reales no todos cero tales que 


01V1 +09V29+.. + QkVk = 0 


Sin perder generalidad podemos considerar que q, % 0. Teniendo en cuenta 


que f(v;) = A;v;, la imagen por f de los dos miembros de la igualdad anterior 
es 


01 A1V1 + Q2À2V2 +... H ORApVÍ =0 


Si multiplicamos la primera igualdad por Az y se la restamos a la segunda 
obtenemos 


Qı Ay Ar)V1 + am(A Sr Ax) Va am e a Ol Ori = Ak) Vr-1 = 0 


Como los autovalores son diferentes, por tanto en la expresión anterior los 


paréntesis son distintos de 0, el sistema {v1, va, ..., vx_1) es linealmente de- 
pendiente ya que &ı(àı — Ax) 4 0. Además hemos eliminado el vector vx 
del sistema. Repitiendo el proceso hasta que tengamos un único vector, lle- 
garíamos a que vı = 0, lo que es una contradición ya que por definición el 
vector cero, no puede ser propio. B 
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Otra cuestión previa a la carcterización de la diagonalización de f es la 
siguiente propiedad. Sea A la base de V y P la matriz que determina f. 
Si V posee una base B = {v1, V2, ..., Vn} de vectores propios, entonces P es 
diagonalizable. En efecto, si A es la matriz cuyos vectores columna son las 
coordenadas de los vectores de A respecto de B, entonces D = APA”? es 
diagonal, pues la matriz D determina a f en la base B, y para todo vector 
v; € B, se tiene f(v;) = Av; de este modo las coordenadas de v; respecto 
a B son todas cero salvo la que ocupa el lugar 2 que es el valor propio A; 
asociado a v;. Estas coordenadas son las columnas de D, luego 


A ctrl 
pes ds g 
D= diag(A;, So AIT AS = : 0 A : 
0 0 0 DE 


Como cosecuencia de la propiedad anterior y de la independencia lineal 
de los vectores, es claro que si f tiene n autovalores distintos entonces es 
diagonalizable, ya que V posee una base B de vectores propios formada por 
un vector asociado a cada uno de los autovalores. Este es el caso más simple 
de diagonalización 


4. 10. Ejemplo. 


Consideremos en R? la base canónica A y f una aplicación lineal definida 
por la matriz 


FE 
P= 3 —ö 0 
R2 R2 3 


Los autovalores de P son 1,—2,—1. Los tres subespacios asociados son de 
dimensión uno. Un vector propio asociado a à = 1 es vı = (0,—1,1). Un 
vector propio asociado a Ag = —2 es va = (1, 1,0). Un vector propio asociado 
a Ag = —1 es vz = (2,0,1). Por tanto B = {v1, va, v3) es una base de R* y 
la matriz de las coordenadas de A respecto de B es 


-1 


e Mi 
O o = Sl 2 
L Ori 
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entonces D = APA”!, es decir 


EP Dd —2, 2 0 1 2 1 0 
DE r =l 2 2x 3 =y9 —6 |x| tt 1 0 J=ļ| 0 -2 
1 —1,=1 2 2 3 lag 0 Ml 0 


v D determina f en la base B. 


Supongamos ahora que (A, Az, ..., A) son los autovalores de f con mul- 
tiplicidades respectivas mM, Mz, ..., Mx. Probemos que la condición necesaria 
y suficiente para que f sea diagonalizable es que la suma de las multipli- 
cidades sea igual a la dimensión del espacio. La demostración se basa en 
encontrar una base en la que f se defina mediante una matriz diagonal. El 
razonamiento utilizado es el mismo que el empleado en la última propiedad 
sobre la independencia lineal de los autovectores asociados a valores propios 
distintos. 


Teorema de caracterización. La condición necesaria y suficiente para 
que f sea diagonalizable es que f posea [A1, Az,..., Ax) autovalores tales que 
si sus respectivos órdenes de multiplicidad son Mmi, M2, ..., my se cumpla Mı + 
mat... + Mi =N. 


Demostración. La condición es necesaria. Si f es diagonalizable existen k 
números A1, Az, ..., Az tales que definen una matriz diagonal 


=> diag(A1, ..., Az, Ao, 0005 Ao, nes Àk, 0005 Ax) 


que determina a f. Como la matriz D es de orden n, la suma de las m; veces 
que se repite cada número A; en D necesariamente tiene que ser n, que es el 


número de elementos de la diagonal. Además si 


mi 1 m1 1 ma 1 Mk 
Di=-(w3, 0 a A VV } 


es la base de Y a la que está referida la matriz D, entonces es claro que 
respecto a la base D las coordenadas de un vector cualquiera vi de D, en 
donde 1 < j < k y 1 < l < m;, son todas O salvo la del vector respecto a 


si mismo que vale 1. En otras palabras, vi = (0,0, ..., 1,0, ...,0) siendo 1 la 
coordenada del lugar mı + ma +... + mj-1 +1 que ocupa el vector vi en la 
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base D. Si denotamos por (x/) la matriz columna de las coordenadas de v$, 
resulta que 


diaa, A A A aa A 


esto es 
FHvi) =Ajvi 
con lo que A; es un autovalor y ví un autovector de f para Aj. 


mi k 
Por otra parte, como todos los vectores Lv, in 7) son lineal- 


mente independientes (pertenecen a la base D) y tienen a À; como valor 
propio, la dimensión del espacio que generan, es decir, del subespacio asocia- 
do a À; es my. 


La condición es suficiente. Sea A; = {u}, u?, ..., u/..., u, } una base del 
espacio Ker(f — AjI) asociado al autovalor Aj. De acuerdo con la condición 
del enunciado, la unión Ay U A2 U ..... U A; consta de n vectores. Probemos 
que estos vectores son linealmente independiente, es decir constituyen una 


base de V. Supongamos que no lo son, entonces existen n números reales 


AZ mi 1,2 mj i o2 Mk 
Hi» Hi» +, Hi yeee Hjo go ees Hj y +3 Hk Mks >> Hk 


no todos 0 tales que 


l=mı l=m2 l=mk 
Pa mea Lal =0 
PU + 2, H202 F ce... py Uy, = 
[=1 [=1 [=1 
. . ME l=mo L l . 
Si designamos por w; = ) -1° yu;, se tiene 


wi Wat... +Wj¡+..+W¿=0 


Cada w; es una combinación lineal de los vectores de la base del subespacio 


Ker(f — A¿f) asociado al valor propio Aj, por tanto es un vector propio 
asociado a A;. Aplicando f a la igualdad, se tiene 


A1W1 96 A9 Wa Ea AjWj “Pus E AL Wk == 0 


con lo que restando de esta última igualdad la anterior multiplicada por A: 
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(Àz = A1) Wa ar (A; = A1) Wj +... + (Xk = ÀL)Wk = 0 
v aplicando de nuevo f 
OS = A1)A2W2 +... + (As — A1)Aj¡W) JF bos SE 07 = A1 )AkWk =0 


con lo que restando a esta expresión la anterior multiplicada por A2 


Os — M1) (3 — A2)w3 + HA ANA; —Aà2)w; +... + (Àk ANO —A2)W ="0 
Repitiendo el proceso, se van eliminando los vectores hasta que en el último 
paso resulta 


(Ak — A1) (àk == A2) (Àk B Az) áuoVo (Ak T Ak—1)Wk =0 


Como todos los autovalores son diferentes, necesariamente wz = 0. Si ahora 


en el penúltimo paso sustituimos wą = 0, se obtiene wz... = O. Es decir, al 
efectuar el proceso a la inversa vamos obteniendo cada w; = 0, con lo cual 


l=mj; 


Ys 


Por consiguiente, para cada j = 1,2,...,k se tiene 
$ u” 
uju; + a +. Huj uj =0 


como A; = al... u7} son linealmente independientes por ser 
uj, us, j 


.) JOERI 
una base de e f- XI ), los escalares tienen que ser O 


==. =4"=0 
Esto contradice la hipótesis que hicimos. 


Como consecuencia A; U As U ..... U Aj es una base de vectores propios 
y f es diagonalizable siendo su matriz en esa base 


diag(A, 0005 Az, A, 0005 Ao, 0005 Àk, us Ax) 
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E 


En resumen, supuesto que se considere la base canónica A en V, para 
estudiar si la matriz A que determina la aplicación f es diagonalizable, y en 
su caso obtenerla, se procede de la manera siguiente: 


1. Se determina el polinomio característico, los autovalores y sus multi- 
plicidades y las dimensiones de los subespacios asociados a cada autovalor. 
Todas las soluciones del polinomio característico tienen que ser reales. 


2. Si la dimensión del subespacio asociado a un autovalor no coincide 
con su multiplicidad, la matriz no puede ser diagonalizable. En caso con- 
trario, es decir, si la suma de las multiplicidades coincide con la suma de las 
dimensiones de los subespacios, la matriz es diagonalizable. 


3. Si la matriz es diagonalizable, su matriz diagonal D tiene como diagonal 
principal los autovalores repetidos tantas veces como indique su multiplici- 


dad. 


4. Para determinar la matriz de paso Q tal que D = QAQ}, se halla 
una base B de vectores propios formada por las bases de los subespacios 
asociados. Los vectores de la base B se ordenan con el mismo orden que 
tengan los autovalores en la matriz diagonal que hemos considerado. 


5. La matriz de paso Q, tal que D = QAQ”?, es la inversa de la que tiene 
como columnas las coordenadas de los vectores de B. (Matriz de cambio de 
A a B). 


Obsérvese que si la matriz tiene n autovalores diferentes, la multiplicidad 
de todos es uno y coincide con la dimensión de cada subespacio asociado, por 
tanto la matriz es diagonalizable. Véase Ejemplo 4.9. 


4.11. Ejemplos. 


a) La matriz del Ejemplo 4.8. a) no tiene autovalores reales, por tanto 
no existe una matriz diagonal equivalente a ella en el cuerpo de los números 
reales. 


b) La matriz del Ejemplo 4.8. b) tiene un valor propio À = 1 de multi- 
plicidad dos. El subespacio asociado tiene dimensión uno, por tanto no es 
diagonalizable. 
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c) La matriz A del ejemplo 4.8. c) es de orden tres y tiene tres autovalores 
6,3,—3, luego es diagonalizable. La matriz diagonal es 


Una base de vectores propios está formada por 
B = ((-2, 13,1), (-1,2, 1), (=2, 4, 1)}. 


El primer vector corresponde a la base del espacio E, asociado al autovalor 
A = 6, el segundo a una base de Ez asociado a Àz = 3 y el tercero a una 


base de Ez asociado a Az = —3. La matriz de paso es 
2 1 
al A e 
Q= BEP = Id 2 
1 1 1 11 1 1 
9 9 


inversa de la que tiene como columnas las coordenadas de los vectores de 
B en el orden en que se encuentran colocados los autovalores en la matriz 
diagonal. Compruebe el lector que D = QAQ”?!. 


d) La matriz A del ejemplo 4.8. d) es de orden tres y tiene dos autovalores 
0 y 2. El primero de ellos A = 0 es doble y su subespacio asociado Ex tiene 
dimensión dos. El segundo A = 2 es simple.y su subespacio asociado Lx 
tiene dimensión uno. La suma de ambas dimensiones es tres y coincide con 
el orden de.la matriz A. Como consecuencia del teorema de caracterización 
A es diagonalizable y su matriz diagonal equivalente es 


0 0 
IDI 0 0 
0 2 


o GS G 


Una base del subespacio Æ es {(1, 1,0), (—2,0,1)} y una base de Ez es 
((1,3,2)), por tanto 


Baa a o Aa, 3,2) 
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es una base de vectores propios. La matriz de paso es 


=I 


I =2 Í 
=> (4 FOS 
0.14 2 


Compruebe el lector que D = QAQ”?. 
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Ejercicios y cuestiones propuestos 


1. Sea la aplicación f : R? — RÍ, definida por 
f(x1, 22,13) = (12 + 23, Ta — 51, 81 + 222). 


a) Pruébese por la definición que f es una aplicación lineal. 
b) Encuéntrese la matriz que determina f. 


2. Defínase una aplicación lineal en los siguientes casos. 
a) De R3, con la base canónica, en R? con la base ((1, —1), (1, 0)). 


b) Del espacio de las matrices Mo3x2 en si mismo con la base 


B= (05) 5037.10 = Usii 23) 


3. Sea la aplicación f : R? — R?, definida por 
f(x1, £2, 13) = (12 + 23, 21 — 222) 
referida a las bases canónicas. Determínese f7*(1, 2). 


4. Sean f una aplicación lineal de R? en R?, ambos espacios con la base 
canónica, y f una aplicación lineal definida por 


, 
t 


f(1,0,0) T (2, O 1, 0) = (0, = F(0,0, 1) T (T 1) 


a) Determínese la matriz asociada a f. 

b) Determínese f(—1, 2,1). 

c) Determínese un vector de R? cuya imagen es (1, —3). ¿Cuántos vectores 
de R? lo cumplen?. ¿Constituyen un subespacio vectorial?. 

d) Determínense las ecuaciones de Ker f, su dimensión y una base. 


e) Determínense las ecuaciones de Im f, su dimensión y una base. 
5. Estúdiese si la aplicación lineal f : R? — R*definida por 


Sero aoe ez, r +y — 2) 
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y referida a las bases canónicas es inyectiva. 


6. Sea R? con la base Lu, us, uz) y R4 con la base {w1, W2, W3, Wa). 


a) Determínese la matriz de la aplicación f : R? — R* definida por 


f(u) = 2W1 = WwW = 3W3 
f(u2) = -w1 + W2 — W3 + Wa 


F (uz) = Wa + Wa 


en donde (u;, uz, uz) es una base de R? y {w1, W2, W3, W4 } una base de R!. 


b) Determínense las ecuaciones de Ker f, su dimensión y una base. 


c) Determínense las ecuaciones de Im f, su dimensión y una base. 


7. Sea f : R3 — R? una aplicación lineal de ecuaciones 


= 2 
Ya 1 Al T3 
respecto a las bases canónicas ([e;, €2, ez) de R? y {€1, €2} de R?. Determínese 


la matriz de f en las bases {(1, 1, 1), (—1, 2, 0), (1, —1,0)) de R? y ((2, 1), (—1, 2)) 
de R?. 


8. Sea P la matriz que define una aplicación lineal f : V > V en donde 
V es un espacio vectorial de dimensión n, en el que se ha considerado una 
base A. Explique las siguientes cuestiones. 


a) ¿Cómo se determina el rango de f?. 


b) ¿Cómo se encuentra la dimensión y una base del espacio imagen y se 
determinan sus ecuaciones?. 


c) ¿Cómo se encuentra la dimensión, una base del núcleo y se determinan 
sus ecuaciones?. 


9. Sea A = [(1,0,—1), (0, 1, 1), (—1, 1, —1)f una base de R$ y sea B la 
base canónica de R?. Si la matriz asociada a una aplicación lineal f : R? — R? 


es 
2 -10 
Pda sm) 








Aplicaciones lineales 107 


determinar la matriz Q asociada a f en las bases 
A! =41(0, 0/12 MIN) 10:22 DAD). 
Compuébese que el rango de las matrices P y Q es el mismo. 


10. Sean los espacios V de dimensión n y W de dimensión m. Si P es la 
matriz que determina la aplicación lineal f : V —> W con las bases A y B 
respectivamente y Q es la matriz que determina f considerando dos nuevas 
bases A’ y B’, pruébese que el número de columnas linealmente independi- 
entes de las matrices P y Q es el mismo. 


11. Sea P la matriz que define una aplicación lineal f : V —> V en donde 
V es un espacio vectorial de dimensión n, en el que se ha considerado una 
base A. Explique las siguientes cuestiones. 

a) Si en el espacio imagen en vez de la base A se considera una nueva 
base B, ¿cómo se determina la matriz Q asociada a f en B?. 

b) ¿Son P y Q equivalentes?. 

c) ¿Si P es diagonalizable lo es también Q?. En caso afirmativo su repre- 
sentación diagonal es la misma? 


12. La matriz asociada a una aplicación lineal f de Rf en si mismo, 
respecto a la base canónica, es 


E: 
mo 2 A 
id PA 
O E 


a) A partir del rango de la matriz dígase cuales son el rango de f, la 
dimensión de Im f, la dimensión de ker f. 

b) Determínese una base de Im f y a partir de ella sus ecuaciones paramétri- 
cas e implícitas. 

c) Dada la base de Im f encontrada en b) complétese una base de R* y a 
partir de ella obténgase una base del núcleo y sus ecuaciones. 


13. Sean A y A dos matrices. Razónese que son equivalentes si sólo si se 
cumple una cualquiera de las siguientes condiciones: 
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a) Están asociadas a una misma aplicación lineal respecto a determinadas 
bases. 
b) A y 4' son del mismo orden y tienen igual rango. 


14. Sea f : R? — R? la aplicación lineal definida por la matriz 


1 00 
PRE VR 
LA 


en una determinada base {u;, u2, uz) de R3. Determinar los valores propios 
y las ecuaciones de los subespacios propios asociados a ellos. 


15. Razónese si es diagonalizable la matriz P del ejercicio anterior. 
16. Estudiar si la aplicación lineal f : R? — R? definida por la matriz 


Z We 
j= T Sl 
TE 


en la base canónica es diagonalizable. En caso afirmativo encontrar la matriz 
diagonal D y la base a la que está referida. 


17. Aplicar el teorema de caracterización para estudiar si son diagonali- 
zables las matrices. 


1.0. 1 
a? LS 
0 1-1 
7 4—4 
posia 
—4 -1 8&8 
das ONE 
ca 3-1 6 
=2 O 


18. Estudiar si la aplicación lineal f : R? — R? definida por la matriz 
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1-3 S 
PES —=38 
6 —6 4 


= la base canónica es diagonalizable. En caso afirmativo encontrar la matriz 


Zagonal D y la base a la que está referida. 


19. Sea la matriz P del ejercicio anterior referida a la base 
A =((1,0,1), Q,-1,1), 1,0, -2) 


a) Determínese la matriz Q respecto a la base canónica. 


b) Estúdiese si Q es diagonalizable y en caso afirmativo hállese la matriz 
diagonal D y la base a la que está referida. 


20. Sea P la matriz que define una aplicación lineal f : Y —> V en donde 
“7 es un espacio vectorial de dimensión n, en el que se ha considerado una 
base A. Explique las siguientes cuestiones. 


a) ¿Cómo se determinan los autovalores y los subespacios asociados a 
ellos?. 


b) ¿Qué condición tiene que cumplir P para que sea diagonalizable?. 


c) En caso de que cumpla la condición anterior, ¿cómo se determina la 
matriz diagonal y la base de V respecto a la que define f. 


d) ¿Existe una única expresión de la matriz diagonal D?. ¿De qué depende 
la expresión de de la matriz diagonal?. 


21. Si en el ejercicio anterior cambiamos la base A por una nueva base 
B. Explique las siguientes cuestiones. 


a) ¿Qué relación tienen los rangos, los polinomios característicos y los 
autovalores de las matrices P y Q.? 


b) Si P es diagonalizable, ¿qué relación tiene con los autovalores? 





Capítulo 5 
Formas cuadráticas 


1. Introducción y objetivos. 


El interés de las formas cuadráticas es su aplicación a la geometría y 
de forma concreta al estudio de las cónicas (elipses, parábolas e hipérbolas) 
y de las cuádricas (elipsoides, paraboloides e hiperboloides). Las primeras 
ya son conocidas por el lector y las segundas son superficies en el espacio 
de tres dimensiones, algunas de las cuales aparecerán en los ejercicios de 
capítulos posteriores. También encontraremos su aplicación en el estudio de 
los máximos y mínimos locales de funciones de varias variables. 


Para el estudio de las formas cuadráticas necesitamos previamente el con- 
cepto de aplicación bilineal y : V x V > Y, es decir, una aplicación lineal 
respecto a cada una de sus dos variables. Consideremos el espacio Y de di- 
mensión finita y sus vectores referidos a una base prefijada del espacio. Igual 
que sucedía en el caso de las aplicaciones lineales, y queda determinada por 
una matriz A, y si efectuamos un cambio de base obtenemos una matriz B 
diferente de A, que define a y en la nueva base. Precisamente, la relación 
existente entre A y B da lugar al concepto de matrices congruentes. 


A partir de la aplicación lineal p definiremos una forma cuadrática w : 
YV — R mediante la igualdad w(v) = p(v, v). Es claro que la matriz que 
define a y define también a w, y por tanto w tiene una expresión diferente 
para cada base. Ahora bien, existe una única forma bilineal simétrica que 
determina la forma cuadrática w a la que se denomina forma polar de w. 
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Como consecuencia del comentario anterior, podemos preguntarnos si 
existe una base de V en la cual la matriz que determina la forma polar sea dia- 
gonal. La respuesta es afirmativa y para probarlo introduciremos el concepto 
de vectores conjugados. Una vez más buscaremos la manera más sencilla para 
determinar la aplicación que estudiamos, es decir, la forma cuadrática w. 


En caso de que la base de V no se indique explícitamente se sobreentiende 
que se trata de la base canónica. 


1.1 Objetivos. 


1. Conocer las diferentes clases de aplicaciones bilineales. Determinar las 
matrices que las definen y efectuar los cambios de base. 


2. Definir las formas cuadráticas a partir de las formas bilineales y vice- 
versa. Determinar la forma polar. 


3. Determinar bases de vectores conjugados y las formas diagonales. 
4. Determinar las bases y la matriz diagonal reducida. 
5. Determinar la signatura y la inercia de la forma cuadrática. 


6. Clasificar las formas mediante la matriz reducida y por el criterio de 
los determinantes. 


2. Aplicaciones bilineales. 


Recordemos que la matriz transpuesta de una matriz A se denota por AT. 
Como de costumbre, en todo el cálculo matricial que sigue, la matriz X de 
las coordenadas de un vector v es una matriz columna, por tanto la matriz 
fila de las coordenadas es XT. 


Definición de aplicación bilineal. Sea V un espacio vectorial. Una 
aplicación y : V x V —> R se dice que es bilineal si para todo v, v, ,w,w € V 
y A, u E€ R se cumple: 
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i) p(Av+pv”,w) = Ap(v, w)+up(v, w) 
ii) p(v, Aw+uw”) = Ap(v, w)+pup(v, w’) 


5.1. Ejemplos. 


a) En V = R? el producto escalar p(x, y) = 21Y1 + Z2Y2 es una aplicación 
bilineal. En general, el producto escalar de R” definido por 


p(v, W) = 11Y + ZoYa +... + EnYn, 


en donde v = (£1, £2, ..., Ln), W = (Y1, Y2, --- Yn), es una aplicación bilineal. 
b) En R? la aplicación p(x, y) = 11Y2 — T2Y1 es bilineal. 


c) En el espacio P(x) de los polinomios, con la base {1, 2, O TR, 
su producto (p(x), q(x)) = p(x)q(x) es bilineal. Si x = a es un valor fijo, 
entonces la aplicación y(p(x£), q(x)) = p(a)g(a) también es bilineal. 


d) Es muy sencillo comprobar, teniendo en cuenta las propiedades del 
producto de matrices, que si V es un espacio de dimensión n, cualquier matriz 
A de orden n define la aplicación bilineal y(x, y) = X T AY. 


La definición de aplicación bilineal dada anteriormente es válida cualquiera 
que sea la dimensión del espacio V. A partir de ahora consideraremos que y 
tiene dimensión n. 


La propiedad básica de la teoría de aplicaciones bilineales es justamente 
la propiedad recíproca del último ejemplo: a toda aplicación bilineal de V se 
le puede asociar una matriz. En efecto, fijada una base A = Luz, uz, ..., Un) 
de V, si las expresiones de los vectores son 


vV = TiU + 2209 +... + TnUn = ) Tili 


i=1 


W = y1U + Y2U2 +... + YnUn = X yui 


i=1 


como y es lineal respecto a cada una de las variables, entonces resulta 


p(v,w) = 703 20, 10) z D Tiyjp (Us, uj) 


ij=1 
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cuya expresión matricial es 


p(u,u) ..... y(u, Un) Yi 
p(v, w) = ( O IA a ) ae Y2 
(Un, u) ee.. (Un, un) Yn 


que en forma abreviada escribimos (v, w) = XTPY. La matriz P = (p(u;, u;)) 


determina la aplicación bilineal y se llama matriz asociada a q. 


Consideremos otra base B = {v1, va, ..., Vn} y estudiemos la relación que 
existe entre las matrices P y Q asociadas a y en cada una de las bases A y 
B. Si las matrices columnas de las coordenadas de v y w en la base B son 
X e Y, entonces 


p(wv,w) = X*PY = XOY 
Como X = AX e Y = AY, en donde A es la matriz del cambio de base 


(coordenadas de los vectores de A respecto a la base B), sustituyendo en la 
expresión anterior, resulta 


X QY = (AX)TQAY = XTATQAY = XT(ATQA)Y 


con lo cual P = ATQA, ya que la igualdad se cumple cualesquiera que sean 


X e Y. Nótese que al ser la matriz de cambio A regular, también se tiene 
Q = (AT})T PA, en donde AT! = B es la matriz del cambio de B a A. 


El razonamiento anterior motiva el concepto de matrices congruentes: 
dos matrices P y Q son congruentes si existe una matriz regular S tal que 
P = S7QS. Es sencillo demostrar que las matrices P y Q tienen el mismo 
rango, para ello basta probar que los núcleos de las aplicaciones definidas 
por ellas tienen la misma dimensión, con lo cual el rango de las matrices es 
la dimensión del espacio V menos la dimensión del núcleo. Se propone como 
ejercicio. 

Obsérvese que al ser S regular puede considerarse como la matriz de 
cambio de una base inicial de V en una nueva base. 


5.2. Ejemplo. 
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Consideremos en V = R su base canónica A = {e1, €2,€3} y sea B = 
((1,1,1), (23,1, 1), (—1,—1,3)} otra base. Si respecto a la base A, la apli- 
cación bilineal y viene determinada por 


3 —1 2 Yı 
p(v,w)=( z1 za z3)| 1 0 -1 Y2 
2 —1 3 Y3 


cuya matriz designemos por P (P = (p(e;,e;))), determinemos la matriz Q 
de y respecto a la base B. 


Como la matriz del cambio de la base B a la base A es 


lA ll 
BEN AS 
A 


la matriz asociada a ọ respecto a la base B es Q = BTPB, 


il PORTA EE Si 7 
ei l alos D E m S 
o 8 1 LA 3 TS j; 


Compruébese que rango A = rango B = 2. 


Sea V un espacio vectorial de dimensión n, en el que tenemos fijada una 
base A y sea A la matriz que determina la forma bilineal y de Y respecto 
a la base A. Se llama núcleo de y al núcleo de la matriz A, es decir al 
subespacio de Y tal que AX = 0 y rango de y al rango de A. Se dice que 
la forma bilineal es no degenerada si su rango es n, esto es, el núcleo es el 
subespacio (0) y degenerada en caso contrario. Si la matriz A es simétrica 
se dice que la forma ọ es simétrica, en cuyo caso P = PT; y se cumple 


PE NA A 


ya que XTPY es un número (matriz de 1 x 1) y coincide con su traspuesta 
(XTPY)", es decir 


AE AAA (A =Y PX. 
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5.3. Ejemplos. 
a) Sea V = R° y su base canónica A. La forma lineal y determinada por 
la matriz P del Ejemplo 4.12. es degenerada ya que el rango de P es 2. 


b) La matriz P que define el producto escalar (v, w) = 11Y1 + Toya + 
xa ya de R? se determina por los valores g(e;, es), en donde [e,, ez, ez) = 


£(1, 0, 0), (0,1, 0), (0,0, 1)), 
100 
P= 01 0 
0 0 1 


y es no degenerada ya que su rango es tres. Además es simétrica ya que 
A = AT y se cumple (v, w) = p(w, v). 


c) Sea B = {(1,0, 1), (0, —1, 0), (1, 1,—1)} una base de R? y y la forma 
bilineal simétrica referida a B definida por la matriz 


2 -—-1 2 
R= 10 
2 03 


La matriz Q de la forma yọ respecto a la base canónica A es Q = ATPA en 
donde A = B”! es la matriz del cambio de base de A a B 


z] 


F E i ali ao a 
AEB = | W-1 ql A! 
1 0 -1 1 0-1 
y por tanto 
E ql 00 dl 2 0 5 
o= o a TT 10 1-2 -1]= 0 1 1 
1 -1 -i 2108 PANA =3 1 1 


que es simétrica. 
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3. Definición de forma cuadrática. 


Definición de forma cuadrática. Sea y una forma bilineal en el es- 
pacio V. Se llama forma cuadrática asociada a p a la aplicación de V en R 
definida por w(v) = p(v, v). 


Si P es la matriz de y y X son las coordenadas de v en la base considerada, 
entonces w(v) = XTPX, con lo que w(v) es un polinomio homogéneo (sin 
término independiente) de grado dos. Por otra parte, de la definición anterior, 
si la forma bilineal es simétrica, es sencillo comprobar que 

1 
p(v, w = lea a) — w(v) — w(w)] 


Además distintas formas bilineales pueden determinar la misma forma cuadrática. 


5.4. Ejemplos. 


1 2 
3 —4 
base canónica de R? y v = (£1, £2), entonces 


1 2 
w(v)=( 2 JE A) (A) time 


a) Si A = ) es la matriz que define a la forma bilineal p en la 


b) Sean A = ( ; i ) yB= ( ; E ) que definen respectivamente 


a las formas bilineales y y 4 en la base canónica de R?. La forma bilineal 
1 —3 


p +p, cuya matriz es C = ( 3 9 


) define la misma forma cuadrática 


que (p. En efecto 


cf AE (e o 2) (2) +22 


(y) CRA JE ds ) =D 
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Ahora bien, existe una única forma bilineal simétrica que determina la 
forma cuadrática w a la que se denomina forma polar de w. En efecto, si 
y determina w, es decir w(v) = p(v, v), entonces la forma y definida por 


plv, w) =3 [plv w) olw, v) 


es evidentemente simétrica y resulta 


plv, v) = 5 [p(v, v)+p(v, v)] => [w(v)+w(v)] =w(v) 


Además, teniendo en cuenta que 


se cumple la igualdad 
D 1 
plv, w) => [u(v + w)-u(v —w)] 


y si existiese otra forma bilineal simétrica p* tal que p*(v, v) = w(v), se 


tendría también que 
, 1 
p'(v,w) =3 [w(v +w)-w(v —w) 


con lo que Pp(v, w) = p*(v, w). 


5.5. Ejemplo. 
: 3 —2 : 9 
Si A = 4 5) la matriz asociada a la forma (q de Rf en la base 


canónica {e1, e2} = ((1, 0), (0, 1)), para determinar la matriz B de su forma 
polar, tenemos que calcular sus elementos 


p(e;, ej) = > [p(e;, es) + p(e;, es)] 


Como 
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p(er,e1) = (1 a E 


y análogamente p(e;,,e2) = —2, p(es, e1) = 4, p(es, es) = 5, la matriz B es 


Nótese que en forma matricial 


B= ¿(A+ 47) 


4. Vectores conjugados. 


Acabamos de probar que fijada una base A de V, una forma bilineal 
simétrica py pose una única forma canónica y que tiene asociada una matriz 
simétrica. Si consideramos otra base B, entonces y tiene asociada otra matriz 
(resultado del cambio de base) cuya forma canónica es una nueva matriz 
simétrica. Podemos preguntarnos si existe una base de V en la cual la matriz 
que determina la forma polar sea diagonal. La respuesta es afirmativa; para 
razonarla necesitamos el concepto de vectores conjugados. 


Definición de vectores conjugados. Sea y una forma bilineal simétri- 
ca. Los vectores v,w se dice que son conjugados respecto a p si p(v, w) =0. 


Un vector v es conjugado de un subconjunto M de V si lo es de cada uno 
de los vectores de M. En particular v es conjugado de un subespacio E si 
p(v,w) = 0 para todo w € E, para lo cual es necesario y suficiente que lo 
sea de una base de E. Dos subespacios son conjugados si cada vector de uno 
de ellos es conjugado de todos los vectores del otro. 

De acuerdo con la definición anterior, es claro que el núcleo de ọ es el 
conjunto de los vectores que son conjugados de todos los vectores del espacio, 
ya que si P es la matriz de y, X son las coordenadas de v y AY = 0 es la 
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ecuación matricial de Ker y en donde hemos designado por Y las coordenadas 
de un vector w de Ker y 


AY =0 => XAY =0 & p(v, w) = 0 para todo w € Ker y y v € V 


Finalmente, si w es la forma cuadrática definida por ọ, se tiene w(0) = 0, 
pero téngase en cuenta que si Ker y 4 {0} , entonces existen vectores v Æ 0 
tales que w(v) = 0. Recíprocamente, recordando que 


plv, w) => lw(y+w) — w(v) — w(w) 


si w(v) = w(w) = 0 para todo v, w de un subespacio E, entonces y(v, w) = 0 
para todo v, w € E y cada vector de E es conjugado con todos los demás. 


Una consecuencia inmediata del resultado anterior es que si w(v) Æ 0, 
cualquier otro vector u del espacio V es la suma de un vector proporcional 
a v y un vector w conjugado de v. En efecto, supongamos que u = Av + w 
con (v, w) =0 y veamos que existe un único número real A que lo cumple. 
Como 


0 = (v, w) =p(w,u— Av) = (v, u) — Mo(v) 
resulta que 


_elv,u) 


w(v) 


y À queda determinado de manera única. Es obvio que w = u—Av. 


Una base de V tal que cada uno de sus vectores es conjugado respecto a 
y de todos los demás se llama base conjugada. 


Existencia de base conjugada. Todo subespacio E, de V de dimensión 
p < n posee una base formada por vectores tales que cada uno de ellos es 
conjugado respecto a p de todos los demás. 


Demostración. Consideremos en el espacio E, un vector vı tal que w(v;) A 
0. Este vector existe siempre ya que en caso contrario w(v) = 0 para todo 
v € E, y por tanto cada vector de E, sería conjugado de todos los demás y 
cualquier base de E, cumpliría la condición. 
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Sea w(v,) % 0 y supongamos una base {v1, wa, ..., Wp} de Ep. Cada vector 
w; lo sustituímos por un vector w; = w; — Av, conjugado de v; y obtenemos 
una nueva base B, = {vi, wa, na Wh} de E, tal que vı es conjugado del 
espacio Ep—ı que generan los vectores {w3, Wim ws} . (Compruébese que los 
elementos de B, son linealmente independientes y constituyen efectivamente 
una base de E,,). 


Aplicando el proceso anterior a Ep- buscamos un vector va tal que 
w(v2) 4 0. Igual que antes, en caso de no existir cada vector de Ep—; sería 
conjugado de todos los demás y cualquier base de Eņp-1, junto con vı, sería 
una base de vectores conjugados de E, y habríamos concluido. Consideremos 
w(va2) 4 0 y supongamos una base [va,Z3,..., Zp} de Ep_1. Cada vector z; lo 
sustituímos por un vector z; = Z; — Ava2 conjugado de vaz y obtenemos una 
nueva base L va, ts zs} de E,.-1 tal que va es conjugado del espacio Ep-2 
que generan los vectores (Za, PE, z, } ! 


Después de repetir el proceso, como máximo, p— 1 veces, obtenemos una 
base {v1, V2, ..., Vp) de E, formada por vectores conjugados entre sí. a 


A partir del resultado anterior, es claro que el espacio Y y cualquiera de 
sus subespacios E poseen una infinidad de bases conjugadas. Además tenemos 
un procedimiento para hallarlas. Supongamos que {v1, Va, ..., Vn} es una de 
estas bases, entonces los elementos de la matriz P asociada a la forma bilineal 
p (o lo que es lo mismo a la forma cuadrática que determina) vienen dados 
por p(v;,vj) = 0 si i Æ j con lo cual la matriz tiene todos sus elementos 0 
salvo los de la diagonal que son p(v;, v;) = w(v;), es decir, P es la matriz 
diagonal 

D = diag {w(v1), w(va), ....., W(vn)) 


Si para facilitar la notación hacemos w(v;) = A;, y suponemos X las coorde- 


nadas del vector v, resulta que 


w(v) = XD = Az? + A925 ascos SE A 


con lo que podemos expresar la forma cuadrática como una suma de cuadra- 


dos. 


Obsérvese que existen una infinidad de bases conjugadas respecto a la 
forma bilineal y cada una de ellas da lugar a una matriz diagonal diferente. 
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El número de términos no nulos de la diagonal (A; 4 0) es el rango p de D, 
es decir, el rango de la forma bilineal y al que también denominamos rango 
de la forma cuadrática w. La forma cuadrática w se llama degenerada 
si la forma bilineal y es degenerada, es decir, si su rango es menor que n y 
no degenerada o regular en caso contrario. 


En los ejemplos siguientes se va a determinar una base de vectores conju- 
gados. Para lograr una mejor comprensión del resultado, en el primer ejemplo 
se repite paso a paso la demostración de existencia de la base conjugada. En el 
segundo se da un procedimiento más sencillo, utilizado habitualmente, para 
resolver el problema. 


5.6. Ejemplos. 


a) Sea P la matriz que define la forma cuadrática w en la base canónica 
fer, €z, ez) de R? 


Ia 0 
PANZA an= 
0 -1 -2 


determinemos una base conjugada siguiendo el proceso de la demostración 
anterior. 

Elegimos un vector cualquiera, por ejemplo vı = (1, 1,0), tal que w(v1) # 
0 (compruébese que w(v1) = 8). Los vectores 


(vi, W2, W3} = {0r Jl 0), (ue 0, 0), (0, 0, 1), 


constituyen una base de R? (compruébese que su rango es tres). Sustituimos 


los vectores wa y W3 por los vectores w} = W2 — 0V] y W3 = W3 — pv: en 
donde w% y w son conjugados de vı, con lo que ha de cumplirse 
2 3 ) 


(vı, w2) 


p(v,, w3) =0 > y(v1, w-0v1) = p(v,, wW2)—aw(vı) = 0 > a = 
w(vı) 


como 
e ji 
ol E a UNES 
0 -1 -2 0 


y w(vı) = 8, resulta que a = S con lo cual 
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3 S3 
w3 = Wa — QV = (1,0, 0) = gas T0) = G Tg o) 


De forma análoga p(v,,w3) = —1, P = p(v1, W3) 
w(v:) 


Entonces {w}, wz) son una base de un espacio Ez y vı es conjugado a Ea. 
Denotemos vz = w4 = (2, —¿,0). 


=a = (5 801). 


Repetimos el proceso para E> y sustituimos wz por Wz = W3 — YV2 y se 
tiene 


/ 
p(va, w3) = 0 = p(va, w3—yV2) = p(v2, w3)—yw(v2) = 0 > 7 = (va, W3) 
w(v2) 
como 
E Y 0 z 3 
olva,w)=(3 -3 0)| 2 3 -1 TE 
0 -1 -2 1 
y el valor de w(v2) es 
mo omm 3 a 
ww=(p30)[2 31)][-4)== 
0 -1 -2 0 
resulta y = —3, con lo cual 


1 1 3 
W3 = W3 — /V2 = (532) +3 (5-50) =(2)=1,1) 


De esta manera va es conjugado con el subespacio E, de E generado por 


w3. Si denotamos v3 = w3, los vectores 


A fao, (2-30) Ta D} 


constituyen una base conjugada de R3. 


b) Elegimos un vector cualquiera, por ejemplo vı = (1,1,0), tal que 
w(v1) 4 0 (compruébese que w(v,) = 8). La ecuación del subespacio E% 
conjugado con v; es 
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dy Di ap Ly 
(Le 1.0 MA! a” al ro | =0 
0 -—-1 -2 T3 


Efectuado el producto de matrices resulta 


311 + 52 — T3 = 0 


Una base de Ez es {(—1, 1, 2), (1,0,3}. Consideramos el vector va = (—1, 1, 2) 


que es conjugado y linealmente independiente de vı. Repetimos el proceso 
para encontrar un subespacio Eg de Ez conjugado de va. Entonces 


1 2 0 Tı 
(1 Ayp 2 08 =1 mr | =0 
0 -1 -2 T3 


y efectuado el producto de matrices resulta 


£1 — T2 — 523 = 0 


Luego las ecuaciones de Eg son 


321 + 512 — £3 = 0 
Li — T2 — 523 = 0 


y una base es {(13,—7,4)}. Por tanto v3 = (13, —7, 4) es conjugado con vı 


y vz. Como consecuencia 


{vi, va, v3} = {(1, 1,0), (—1, 1, 2), (13, —7,4)} 
es una base de vectores conjugados de R3. 


c) Para la base del ejemplo a), Bı = {(1, 1,0), (#, —ł,0) , (2, —1,1)}, 
como 

LD Y 1 

A AUT IS 1: 1 

0 -1 -2 0 


y análogamente w(v2) =—¿ y w(v3) = —1, la matriz diagonal en la base B; 
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es 
Sum O 
Di=| 0-3 0 
0s= 0 
Para la base del ejemplo b) Ba = {(1, 1,0), (1, 1,2), (13, —7, 4)), como 


w(v1) = 8, w(v2) = —12 y w(v3) = —24 


la matriz diagonal en la base B2 es 


8 0 0 
D= | 0 —12 0 
0 O —24 


5. Clasificación de las formas cuadráticas. 


Consideremos una base conjugada A = {v1, V2, .., Vn} para la forma 
cuadrática w. Los elementos A; = w(v;) de su matriz diagonal pueden ser 
positivos negativos o nulos. Es claro que mediante una reordenación de los 
vectores de A podemos hacer que los elementos positivos aparezcan en primer 
lugar, los negativos a continuación y finalmente los nulos. Supongamos que 
A ya está reordenada y definamos una nueva base B = {u;, uz, ..., u, ) de la 
siguiente manera 


1 
u; = —=v,¿siA¡%0 y u = v¿si A; =0 
y 14] 
entonces tenemos w(u;) > 0 si A; > 0, w(u;) < 0 si A; < 0 y w(u;) = 0 si 
A; = 0, con lo cual la expresión de la matriz diagónal D respecto a la base 
B es 
D= dan dede l La 150, 0 ¿jue O $ 


y se dice que D es la matriz reducida diagonal de w, o lo que es equivalente 
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de la forma bilineal y simétrica p que la define. Si (x2,,12,...,1,) son las 
coordenadas de un vector v, la forma cuadrática viene dada por 


w(v) = T] +23 + + 2 — ty — Dg — e T? (1) 


en donde p es el rango de la matriz, q es el número de términos positivos (el 


número de unos) y p — q es el número de términos negativos (el número de 
menos unos). 


Obsérvese que el rango p de la matriz es necesariamente igual para todas 
las posibles matrices reducidas diagonal de w, ya que se trata de un cambio 
de base. Como consecuencia el número de ceros n— p es el mismo para todas. 
La siguiente propiedad nos prueba que también es igual el número q de unos 
y por tanto el número p — q de menos unos. 


Ley de inercia de Silvester. Todas las matrices reducidas diagonal de 
la forma simétrica w tienen el mismo número de elementos positivos. 


Demostración. Supongamos una base (u;, us, ..., Un } respecto a la cual las 
coordenadas de un vector v sean (£1, %2,..., Zn) y la forma cuadrática tenga 
la expresión (1) anterior, con lo que el número de unos es q. Consideremos 
otra base {w1, W2, ..., Wn} respecto a la cual las coordenadas del vector v 
sean (21, 22, ..., Zn) y el número de unos de su forma reducida diagonal sea q’, 
de modo que 


A Ar 2 
US A A 


Para todo vector v Æ 0 del subespacio E generado por los q primeros 
términos de la base, es decir por (uy, U2, ..., Ug} 


w(v)=4+23+...+2>0 


y para todo vector v Æ O del subespacio F generado por (Wy+1, Wy+2, -»-, Wn} 


d 2 2 2 
w(v) Sa —Zg'+1 aP Zg +2 TASA Zp < 0 


Por tanto E N F = {0} con lo que dim E+dim F = q+ (n—q') = dim(E+F) < 
n y resulta q < g. 
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Considerando los subespacios E” generado por {ug+1; Ug+2; ---; Unt y F 
generado por {w1, wo, ..., Wy) y razonando de la misma manera se obtiene 
1 
<a. a 


De acuerdo con el teorema anterior, es obvio que la forma w admite una 
única matriz reducida diagonal que tiene q números positivos, p — q números 
negativos y n — p ceros. Se llama signatura de la matriz D asociada a w al 
número q de elementos positivos, y se llama inercia a la terna (q,p-q,n—p). 
Obsérvese que si n = p la forma es no degenerada y si p < n la forma es 
degenerada. 


Una forma cuadrática w es definida positiva si w(v) > 0 para todo 
v #0. Si w es definida positiva entonces p = q = n, es decir, todos los 
elementos de la matriz diagonal son positivos, con lo que su inercia es (n, O, 0) 
y su núcleo se reduce al vector cero. Nótese que la matriz reducida diagonal 
es la matriz unidad de orden n. 


Una forma cuadrática w es semidefinida positiva si w(v) > 0 para todo 
vector v. Si w es semidefinida positiva, los elementos de la matriz diagonal 
son positivos o ceros, con lo que su inercia es (q,0,n — q), con q < n, y su 
núcleo no se reduce al vector cero, es decir existen vectores v Æ 0 para los 
que w(v) = 0. 


Una forma cuadrática w es definida negativa si w(v) < 0 para todo 
v 40. Si w es definida negativa entonces todos los elementos de la matriz 
diagonal son negativos, con lo que su inercia es (0, n, 0) y su núcleo se reduce 
al vector cero. 


Una forma cuadrática w es semidefinida negativa si w(v) < 0 para todo 
vector v. Si w es semidefinida negativa, los elementos de la matriz diagonal 
son negativos o ceros, con lo que su inercia es (0, p,n — p), con p < n, y su 
núcleo no se reduce al vector cero, es decir existen vectores v Æ 0 para los 
que w(v) = 0. 


Finalmente una forma es indefinida si puede tomar valores tanto posi- 
tivos como negativos, es decir si la matriz diagonal tiene elementos positivos 
y negativos, con lo cual en su inercia (q, p — q,n— p) se tiene q < p. 


5.7. Ejemplo. 
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Consideremos la forma cuadrática w de los Ejemplos 5.6. Para la base de 
vectores conjugados Bə = ((1,1, 0), (-1,1,2), (13, —7,4)), a la vista de su 
matriz diagonal 


8 0 0 
0 O 0 
0 O -—24 


podemos afirmar que su matriz reducida tiene rango p = n = 3, que el 


número de unos (elementos positivos), es decir su signatura es q = 1 y que su 
inercia es (q, p — q,n — p) = (1,2,0). Por tanto es una forma no degenerada 
o regular e indefinida. 


En la base 
D = [(1/V8,1/V8,0), (-1/V13,1/V12,2/V12), (13/V24, -7/V2, 4/1/24) ) 


que ya aparece reordenada, se obtiene la matriz reducida diagonal 


L 0-0 
DE ICAA Y 
UNO =i 


Obsérvese que con conocer cualquier matriz diagonal que represente a w 
en una base ya podemos saber su signatura, su inercia y la naturaleza de la 
forma. 


Sea P = (a¡¡) la matriz asociada a la forma cuadrática w. A continuación 
se expone un criterio práctico para averiguar la clase de la forma cuadrática 
sin necesidad de hallar una matriz diagonal. El criterio utiliza el signo de los 
determinantes A; de las submatrices principales 


P,= E F T 


de A. Su demostración se basa en que las submatrices P, son congruentes con 


las correspondientes submatrices de la matriz reducida diagonal. 


Formas cuadráticas 129 


Criterio de Silvester. Sea w una forma cuadrática en el espacio V de 
dimensión n. Si P = (a;;) es la matriz asociada a w y A; = det A;, entonces: 


a) w es definida positiva si y sólo si A; > 0 para todo 1=1,2,...,n. 
b) w es definida negativa si y sólo si (—1)A; > 0 para todo ¿=1,2,...,n. 


Demostración. Sean A = (uy, U2, ..., Un) la base de V a la que esta referida 
la matriz P y (£1, £2, ..., Zn) las coordenadas del vector v € V. 


a) Si w es definida positiva su restricción a cualquier subespacio E de V 
también lo es. Consideremos los subespacios E; generados por los vectores 
fu, uz, ..., U;} de la base. Si w; es la restricción de w al subespacio E;, la 
matriz de w; es P; y como w; es definida positiva, P; es congruente con la 
matriz unidad / de orden i. Por tanto existe una matriz regular R; tal que 
P, = RTIR;, entonces 


A; = det P; = (det R) > 0 


Reciprocamente. Probémoslo por inducción sobre n. 


Para un espacio V, de dimensión uno, n = 1, es evidente ya que si (a) es la 
matriz que define la forma w y a > 0, entonces w(v) = zax > 0. Supóngamos 
que es cierto para los espacios V,, 1 de dimensión n—1 y veamos que es cierto 
para el espacio V de dimensión n. 

Sea E,,_, el subespacio de V generado por An-1 = {U1, U2, ..., Un—1) y sea 
w' la restricción de w al subespacio Ep—1. Por hipótesis los determinantes A; 
de las submatrices P; de la matriz P,-_1 asociada a w’ en la base A, son 
positivos, es decir, 

Aj > 0, ^2 > 0, EA e > 0 
Como consecuencia, por la hipótesis de inducción, w” es definida positiva y 
existe una nueva base {b;, bo, ..., bn, ) de E,.-1, equivalente a A,-1, respecto 
a la cual la matriz de w’ es la matriz unidad / de orden n — 1. 


Consideremos la base (by, ba,..., b, 1, Un} de V. La matriz P’ asociada 
a w en esta base es de la forma 


1l mo 0 Q1 

0 le. aso 0 Q2 
Ps ¡| IIA A 

A A IE <p 
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Si consideramos una combinación lineal de las n — 1 primeras columnas de 
P' 


1 0 0 Qı 
1 0 Q2 
Qi eeh +0 d=- + Qn=1 = E 
0 0 1 Qn—1 
01 Q2 Chai a? + a? +... + CAR 


y se la restamos a la última columna, obtenemos la matriz 


jea es 00 

0O TIE 0 0 

a= ies e 
dl a N 1 0 

a a Qn- 


Si en P” hacemos la combinación lineal por filas y se la restamos a la última, 


obtenemos 
1 O E 0 0 
UN W 0 0 
Po | E T: 
oo 1 0 
rA O E 0 8 


con lo cual det P™ = 8. Ahora bien, como por hipótesis el determinante A, 
de la matriz inicial P es positivo y por otro lado las matrices P y P” son 
congruentes, ya que ambas son matrices asociadas a la forma w, existe una 
matriz regular Q tal que P” = QT PQ, y resulta 


fB = det P" = (det Q%) (det P)(det Q) = (det Q)?A, > 0 


luego la inercia de w es (n, 0,0) y w es definida positiva. 


b) La forma w es definida negativa si y sólo si —w es definida positiva. Si 
A es la matriz asociada a w, entonceces —A es la matriz asociada a —w, y 
por el apartado anterior —w es definida positiva si y sólo si son positivos los 
determinantes de las submatrices —P;. Ahora bien 


det(—P,) = (=1) det P, = (IA, 
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con lo cual w es definida negativa si y sólo (—1)A; > 0. EJ 


De los resultados anteriores y de las correspondientes definiciones, es claro 
que w es semidefinida positiva si todos los determinantes A; son positivos o 
nulos y semidefinida negativa si (—1)'A; son positivos o nulos. c 


5.8. Ejemplo. 


La matriz 


define una forma cuadrática positiva ya que ^A; = 2, A2 = 3 y Az = 


La matriz 
32 1 
Q=| -2 -4 2 
1 2 —3 


define una forma cuadrática negativa ya que A; = —3, A = 8 y Az = —16. 
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Ejercicios y cuestiones propuestos 


1. Rázonese que en el espacio F (0, 1] de las funciones reales y continuas 
en el intervalo (0, 1] la aplicación 


eno=/ Noto 


es bilineal. 


2. Sea {u;, U2, U3} una base de RÌ. La matriz P que define una forma 
bilineal y en R* viene determinada por p(u;, uj) = i — 2). 

a) Hállese P y g(v, w), en donde v = 2u; — Uz y W = Uu — Uz — Us. 

b) ¿Es y degenerada?, ¿es simétrica?. 

c) Si (b1, b2, b3} es una nueva base tal que bı = u; + uz, bz = uz — uz, 
b3 = uz — us, calcúlese la matriz Q de y respecto a esta base. 


3. Sea V = R” con la base canónica, p : Vx V — V una forma bilineal 
no degenerada y f : V > V una aplicación lineal. Pruébese que la aplicación 
Y: Vx V —> V definida por y(u, v) = p(f(u), f(v)) es una forma bilineal. 
y razónese que y es degenerada si y sólo si Ker f = {0}. 


4. Sea A = [e1,e2,e3) una base de R? y y : RÍXRÍ — R3 una forma 
bilineal simétrica que satisface (e1, es) = —1, (e2, es) = 0, p(ez, ez) = —2, 
p(er, 3e2) = 6, p(e1, —2e3) = —2, p(e, + ez, ez) = 4. Determínese la matriz 
de la aplicación. 


5. Si B = (u;, u2, uz) es una base de R? tal que sus coordenadas respecto 
a la base A del ejercicio anterior son uy = (1,1,0), uz = (-1,2,1), uz = 


(0, 0, 1), determínese la matriz de y en esta base. 


6. Sea [e,, €2, ez) una base de RÌ y y : R3xR? — R3 definida por 


La T3 
Ya Y3 


Li Ta 


e 
Y y|” 


p(u, v) = 











Lag Tı 
Y3 yı 








en donde u = (£1, £2, £3) y V = (y, ya, Y3). Estúdiese si es una aplicación 
bilineal. 
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7. Las matrices P,Q y H 


RO 
Een IO 
0 1 —i 
7 4—4 
Doa Za =1 
—4 -1 8 
ar qee 
E aTe 
-2 0 -—5 


definen tres formas bilineales yp, Yọ y yg en R? con la base canónica. 

a) Determinar cuáles son los polinomios de segundo grado imágenes del 
vector v = (z1, %2,%3) en cada una de las formas cuadráticas asociadas 
WP, WQ y WH. 

b) Determinar las formas polares de wp, wọ y wq- 

c) Si B = {u;, u2, uz) es una nueva base tal que sus coordenadas en la 
base canónica son u; = (1, —1, 1), us = (0, 1,1) y uz = (—1, 2, 0), determinar 
la matriz de yp en la base B. 

d) Encontrar la forma polar de wp en la base B. 


8. Sea w(v) = 2? + 23 + 42,1) — 20,13 + 6x213, en donde v = (11, 22, 23) 
respecto a la base canónica. Encontrar la matriz P que define w. 


9. Sea B = {u;, uz, uz) es una base de R y y una forma bilineal definida 
por la matriz 


> 
PS IEO 
=1, —2 -2 


Si zı + z3 = 0 es la ecuación de un subespacio E de R3, determínense las 
? 


ecuaciones de la forma bilineal (pg restricción de py a E, es decir pg(u, v) = 
y(u, v) para todo u,v € E. 


10. Encontrar una base de vectores conjugados en los espacios R?, R? y 
Rt respecto a las siguientes matrices: 
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11. Sea B = {u;, u2, uz) de R3 y w : R? — R una forma cuadrática cuya 
expresión matricial es 


1 2 —1 Tı 
w(v) = ( Ti REIES ) 2 0 1 Ta 
—-1 1 2 T3 


en donde v = 2,U1] + T2U2 + T3U3. 
a) Encuéntrese una expresión matricial de la forma bilineal y de la que 
procede w. 


b) Pruébese que el espacio Ey generado por (2, —5, —2) es conjugado del 
espacio Ez de ecuación —6x1 + 2x2 — 11x3 =0. 


12. Enuncie un ejercicio como el anterior. Es decir, dada una base B = 
(u,, u2, uz) de R? y una forma cuadrática con su representación polar, fije 
un vector v y las ecuaciones de un subespacio E de modo que el espacio E; 
generado por v sea conjugado de E>. 


13. Sea A =(e,,e2,e3) la base canónica de RÌ y w : Ri — R la forma 
cuadrática definida por 


w(v) = 2x? — 23 + 323 — 121,13 + 22223 


a) Encontrar la matriz asociada. 
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b) Determinar una base B de vectores conjugados y la matriz diagonal 
D asociada a w en esa base. 


c) Determinar la base C, obtenida a partir de B, respecto a la cual la 
matriz asociada a w es diagonal reducida y hallar la expresión de esta. 


d) ¿Cuáles son la signatura y la inercia de D?. 


e) Estudiar si w es regular y clasificarla. 


14. Sea w una forma cuadrática. Demuéstrese que se cumple 


w(u +v +w) = w(u +v) + w(v +w) + w(w + u) — w(u) — w(v) — w(w) 


15. Estúdiese si las formas cuadráticas determinadas por las matrices 


1 0 1 1 0 1 Ee a 
Pha 21 QE l Ro ( 0 E) 
A LA Jero 


a) Son regulares o degeneradas. 
b) Son definidas o indefinidas. 


16. Explique si existe diferencia entre los conceptos de forma degenerada 
y de forma indefinida y proponga ejemplos. 


17. Consideremos que las siguientes matrices 


A 
bd 2 

a(¿ jae 03 a [733 
SA2 PRD 1 


son las formas polares de una forma cuadrática w en el espacio vectorial de 
la dimensión adecuada respecto a una base fijada. En cada caso: 

a) Estúdiese si las formas son definidas y, en su caso, clasifíquense a partir 
de los determinantes de las submatrices principales. 

b) Determínese una base de vectores conjugados y la matriz diagonal 
correspondiente. 
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c) A partir de la base anterior determínese la base respecto a la cual la 
matriz asociada a w es diagonal reducida y hállese la expresión de ésta. 


18. Responder a las cuestiones del ejercicio anterior si la matriz asociada 
a w es 


P, = 


N e N e 
Ne oOrN 
N =e e e 
RHNDNND 


19. Determínense los valores de À para los que la forma cuadrática 


w(a;,t2,13) = L? + 513 + ALŽ + 42,70 + 22173 + 442923 
es definida positiva o semidefinida positiva. 


20. Explique las siguientes cuestiones: 

a) A partir de la matriz de una forma lineal, cómo encontrar la forma 
polar de la forma cuadrática que define. 

b) A partir de la expresión polinómica de la forma cuadrática, cómo 
encontrar la matriz. 

c) Dada la matriz de una forma cuadrática, cómo encontrar su matriz en 
otra base. 

d) Cómo determinar una base de vectores conjugados y la matriz diagonal. 

e) Cómo encontrar la base y la matriz reducida diagonal. 


Capítulo 6 
Funciones reales de una 
variable real 


1. Introducción y objetivos. 


La práctica totalidad de los contenidos de este capítulo son conocidos por 
el lector, por lo que su objetivo es precisar algunas demostraciones, insistir en 
el cálculo algorítmico y profundizar en algunos aspectos del tema aportando 
nuevas propiedades. 


Comienza el capítulo revisando el concepto de límite de una sucesión y 
sus propiedades. Posiblemente, la única aportación nueva respecto a la etapa 
anterior sea la demostración de que existe el límite de sucesiones monótonas 
(crecientes o decrecientes) acotadas. Como consecuencia se propone el ejer- 
cicio 3 sobre la definición del número e, cuya resolución no parece que tenga 
mayor dificultad con las indicaciones que se dan, y también se hace hin- 
capié en el cálculo de límites que lo involucran. 


El concepto de límite de una función en un punto es el concepto esencial 
del Análisis matemático. A partir de él se definen los de continuidad, derivada 
e integral. La idea intuitiva es muy sencilla: si la variable x se acerca tanto 
como queramos a un punto dado a, las imágenes f(x) de la función tienden 
a un valor fijo b. 


Las propiedades de la continuidad de la función en un punto se deducen 
de forma inmediata de las propiedades de los límites. La continuidad en 
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un conjunto nos permite conocer particularidades importantes del compor- 
tamiento global de la función. Se estudian los teoremas de Bolzano, de los 
valores intermedios y de los extremos absolutos de Weierstrass. Cada uno 
es consecuencia del anterior, con lo que sus demostraciones son sencillas y 
no ofrecen mayor dificultad. Por otra parte, estos resultados nos proporcio- 
nan una buena técnica con la que abordar problemas como la separación y 
aproximación de las raíces de una ecuación. 


El estudio local, es decir, el comportamiento de una función en el entorno 
de un punto, requiere también del concepto de derivada, cuyo valor es la tasa 
de variación instantánea de la función en el punto. Por ejemplo, si se trata 
de la derivada de la función s(t) del espacio respecto al tiempo, la derivada 
de s en to nos da la velocidad en el instante to. Una vez más, las propiedades 
de la derivada se razonan a partir de las propiedades de los límites. 


Conocidas mediante su cálculo directo las derivadas de las funciones ele- 
mentales, la aplicación de las propiedades, y de forma particular la regla de 
la cadena, facilitan el cálculo de la derivada de cualquier función. 


El teorema del valor medio es el punto de partida para el estudio de las 
funciones derivables. En primer lugar nos permite disponer de criterios para 
estudiar el crecimiento y decrecimiento de la función y también establecer 
la Regla de L”Hópital, de enorme utilidad en el cómputo de límites. Por 
otra parte está presente en la demostración del teorema de Taylor y sus 
aplicaciones. 


La complejidad de una gran parte de las funciones, que se presentan 
como modelos matemáticos de problemas reales, hace que en la práctica 
necesitemos efectuar los cálculos con funciones más sencillas, como los poli- 
nomios, aún a costa de cometer un determinado error. En otras palabras, si 
no precisamos obtener la solución exacta, podemos realizar los cálculos con 
funciones más sencillas que aproximen a la función original en una cierta 
medida. Uno de estos métodos de aproximación lo proporciona el teorema de 
Taylor mediante una función polinómica. 


Además, a partir del teorema de Taylor podemos determinar elementos 
esenciales de la función: puntos de máximo y de mínimo, puntos de inflexión, 
intervalos de convexidad, etc, que unidos al conocimiento de los límites, nos 
ayudan por un lado a representar las funciones y por otro a resolver diferentes 
clases de problemas que surgen en la práctica. 
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Antes de comenzar el tema es conveniente precisar las operaciones 1 x 
y —00, para lo cual debemos ampliar la recta con estos dos elementos. 


1.1. La recta real ampliada. 


El significado de que una sucesión de números reales tenga límite +0c es 
que su término general se hace tan grande como queramos. Esto nos mueve a 
considerar +00, (al que denotamos simplemente por oo si no hay confusión). 
como un elemento mayor que cualquier número real y a —oo como un ele- 
mento menor que cualquier número real. Si añadimos a la recta real estos 
elementos, obtenemos la recta real ampliada R = RU(-—0oo, +00). Y 
aunque —o00 e +00 no son números reales, de acuerdo con la interpretación 
dada, podemos convenir que si À es un número real se cumple 


1. La suma de oo con À o con oo es oo y su producto por À es oo o —o0 
dependiendo si A>00 A<O. 


00 +A =00; 00 + 00 =00; 004 =00 si A> 0; o0A =—oo si A<0 


2. La suma de —oo con À o con —oo es —oo y su producto por À es —oo 
o œ dependiendo si A>00 A<0O. 


00 +A = —00; —00—00 = —00; (—o0)A =—oo si À > 0; (—o00)A = 00 si A<O0 


Recuérdese que en el producto se cumple la regla de los signos y lo mismo 
sucede en el caso de infinitos 


00.00 = 00; (=00)(=00) = œ; (00) (+00) = (+00) (00) = —00; 


Sin embargo no podemos afirmar nada si la expresión es co — œ 0 00 X 0, 
y decimos que es una indeterminación. 
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1.2. Objetivos. 


1. Revisar el concepto de límite de una sucesión de números reales y los 
métodos de cálculo. 


2. Determinar límites de funciones. 

3. Estudiar la continuidad de una función en un punto y en su dominio. 
4. Aplicar el teorema de Bolzano para separar las raíces de una ecuación. 
5. Derivar funciones. 

6. Aplicar la regla de L'Hópital para calcular límites. 


7. Encontrar el desarrollo de Taylor de una función y las cotas de error 
al aproximar la función por el polinomio. 


8. Determinar los extremos relativos y absolutos de una función. 
9. Determinar los puntos de inflexión y los intervalos de convexidad. 


10, Representar funciones. 


2. Sucesiones de números reales. 


Una sucesión de números reales es una aplicación s de los números 
naturales N en R, es decir s : N > R. Si s(n) = an, la sucesión se suele 
representar por su término general (a,,). 


En el Capítulo 3, Ejercicio 1, hemos visto que el conjunto S de las suce- 
siones de números reales con las operaciones suma y producto por un número 
real À 


(an) + (bn) = (Gn +bn) 
Alan) = (Xan) 


es un espacio vectorial. Además si una sucesión (b,,) tiene todos sus términos 


a 
distintos de cero, bn 4 0, podemos definir la sucesión cociente E) entre 


(an) y (br). : 
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Si cada término de la sucesión es mayor o igual que el anterior, es decir 
Am < An+1 para todo n E N, se dice que la sucesión es creciente y si cada 
término es menor o igual que el anterior, es decir an > an+ı para todo 
n € N, se dice que es decreciente. En caso de que an < a@n+ı diremos que 
es estrictamente creciente y si a, > Qn+1 dieremos que es estrictamente 


decreciente. Esta clase de sucesiones se llaman monótonas. 


Una sucesión es acotada si existe un número k > 0 tal que la, | < k. Es 
obvio que una sucesión no acotada puede estarlo superior o inferiormente. 


Sea o : N —> N una aplicación creciente, es decir tal que o(n + 1) > a(n) 
para todo n € N. Una subsucesión s de (an) es la composición de s y ø, esto 
es sog : N > R, de modo soo(n) = s|o(n)] y el término general de la 
subsucesión de (an) es (mes): 


6.1. Ejemplos. 


n*—1 
a) Si s(n) = n 


eneral Lai 
nera : 
: n3+1 
b) Existen sucesiones que no podemos representar por su término general 


y que se definen mediante una regla o algoritmo. Por ejemplo la sucesión que 
aproxima v3 y procede de la extracción de la raíz 





, la sucesión la podemos representar por su término 





{1; 1,7; 1,73; 1,732; 1,7320; 1,73205; 1,732050, ............ } 


2n — 1 


3n +1 
ya que es sencillo comprobar que 





c) La sucesión (an) = ( ) es una sucesión estrictamente creciente 


2n-1 E A al 
3n+1 ` 3(n+1)+1  3n+4 
2n — 1 
3n+1 


Si a(n) = 2n + 1, el término general de la subsucesión (as(n)) es 





Además es acotada ya que 
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atras 


Obsérvese que la sucesión es 





ESE TABA St 2n—T 


y la subsucesión 


a e Zn sil 
10° 16° 22° 28' ' 3w 





n} 1 
d) La sucesión ( 21] es estrictamente decreciente y es acotada ya 
n 


que está contenida en el intervalo [0,1/2]. Dos subsucesiones de ella son 


: ue corresponde a o(n) =n +1 


corresponde a o(n) = 3n + 2. 


ns): E 


e) La sucesión (an) = (—1 )” no es creciente ni decreciente, es decir no es 
monótona, sí es acotada. Una subsucesión es la sucesión constante (1). 


n? — 





f) L i ; 
) Las sucesiones (n*), ( Pr 


superiormente. La sucesión 


E E A, TE 1 
JP 3? 9 4’? 5’ 5? 6’ da q e oonoccsncsaso 


n 3 7 
) son crecientes pero no están acotadas 


es creciente pero no estrictamente creciente. 


La idea intuitiva de límite de una sucesión es muy clara. A medida que n 
toma valores cada vez mayores el término a, se aproxima cada vez más a un 
número fijo a. La sucesión del ejemplo 6.1 b) tiene como límite V3. Además, 
veremos que en caso de que exista el límite de una sucesión, entonces es un 
único número. 


Definición de límite de una sucesión. Se dice que el límite de la 
sucesión (an) cuando n tiende a œ es a € R, si para todo e > 0 existe un 
número natural no tal que si n > Ny se tiene la, — al < e. 
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Obsérvese que no depende del valor de aproximación £ que hayamos fijado. 

Si a es el límite de (an) escribimos lím a, = a o bien líma, o (an) => 
n—00 

a. También decimos que la sucesión converge o es convergente a a. Si la 


sucesión no tiene límite decimos que es divergente. 


Una sucesión (a, ) tiene límite +00 si para cualquier número K > 0 tan 
grande como queramos existe no tal que a, > K y decimos que el límite 
es —oo si (—an) tiene límite +00. Como +00 y —oo no son números reales, 
en un lenguaje estricto, las sucesiones que convergen a ellos no se pueden 
considerar convergentes, así que por sucesiones convergentes entenderemos 
aquellas que tienen límite finito. 


Propiedades de las sucesiones convergentes. 


1. El límite de una sucesión, si existe, es Único. 


Demostración. Supongamos que no es cierto y existen a y b tales que 
aXFby lím a, =a, lím a, = b. Sea e = |b— a] > 0 
n—00 n—>00 
Como Lim an = a, dado e/3 existe nı E N tal que para todo n > nı se 
tiene |an — al < e/3. 
Como lím a, = b, dado e/3 existe no € N tal que para todo n > na se 


n—>00 
tiene |an — b| < £/3. 
Entonces, si n = máx {n1, n2} para todo n > ny se tiene 


2 
bal =b- an + an -al< lan =b] + lan a< Eti 


lo que es una contradición pues |b — a| = e. E 


2. Toda sucesión convergente es acotada. 


Demostración. Si m an = a, dado £ > 0 existe ny € N tal que para todo 


n > ny se tiene |an — al se SEO máx [la;| laz! , [as] ,...., lan, | +, entonces 


[an] = |an — a + a] < |an — a| + la] < e + la] 


para todo n > ngo, con lo cual 


Ja, | < máx Lc, e + |a|} = k 
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para todon E€ N. [O] 


3. Si lím an =a, ím bn = b, entonces ím (an +bn) = a +b. 
N—>00 


Demostración. Sea £ > 0. 

Como m an = a, dado e/2 existe nı € N tal que para todo n > nı se 
tiene |an — da BEf2 

Como mm bn = b, dado e/2 existe no € N tal que para todo n > ng se 
tiene |an — se EZ: 

Entonces, si no = máx£n,,n2) para todo n > ny se cumple 


jan + bn — (a +b)| < lan — al + lbn 0] < +5 =8 


y lím (An + bn) =a +0. O 


4. Si lím a, =a y AER, entonces lím (Aan) = Aa. 
n—>00 n—>00 


Demostración. Podemos suponer A Æ 0, ya que si À = 0, seria (Aan) = (0) 
cuyo límite es obviamente 0. Sea e >0. 
A] existe ny E N tal que para todo n > ny se 


Por tanto, se cumple 


Como lím a, = a, dado 
n—>00 


tiene |an — a| < ==. 
iene |an — q| A 


Aan = Aa] = [A| Kan = a)l < A ¡57 =E 
para todo n > ny y por tanto lím (Aan) = Aa. [ea] 


5. Si lím a, =a, ím bn = b, entonces lím (anbn) = ab. 
Nn?+00 Nn—?00 


Demostración. Sea e > 0. Como (an) está acotada (Propiedad 2) existe 
k > 0 tal que |an| < k. Podemos suponer que b Æ 0, ya que en caso contrario, 


por ser lím bn = 0 dado ñ > 0 existe no tal que para todo n > ny se tiene 
n—00 
€ 
k 
y ilan 0: 


n—> o0 
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Por ser lím a, = a, dado 7 existe nı E N tal que para todo n > nı se 


n>00 2 Fa 
tiene |an — al < — 
€ 
Por ser m bn = b, dado 2% existe n E N tal que para todo n > na se 
tiene | b a 
i An — 
2k 


Entonces, si no = máx {n1, n2} para todo n > ny se eee 


lanbn — ab] = |anbn — anb + anb — ab] = |an (ön — b) + A — sm < 
< E=, 
< [an] |bn — b| + lb] lan — a] < ko w b| — a ES 
y lím (a,b,) = ab. E] 
n—>00 


6. Sean (bn) y (an) tales que bn + 0 para todo n € .N y lím b= b 0, 
a 


An 
lím a, = a, entonces lím — = >. 
n— oo n—00 b,, b 


Demostración. Es un caso particular de la propiedad anterior para las 


1 
sucesiones (an) y E al 
n 


Como consecuencia de las propiedades anteriores, las sucesiones conver- 
gentes constituyen un espacio vectorial para las operaciones suma y producto 
por un escalar. Por otra parte, no existe ningún método estándar para calcu- 
lar el límite de sucesiones, aunque sí existe para algunas clases que el lector 
ya conoce(cocientes de polinomios y radicales de polinomios de n, diferencias 
de radicales, potencias y raíces,...etc.). En esencia se trata de transformar el 
término general de la sucesión para aplicar las propiedades estudiadas y fa- 
cilitar el cálculo. El estudio del límite de funciones nos proporcionará nuevas 
técnicas. 


6.2. Ejemplos. 


a) Es muy sencillo comprobar por la definición que (1/n) > 0. A partir 
de este resultado los límites de las sucesiones cocientes de polinomios (a,,) = 


P(n 
(as) se obtienen dividiendo numerador y denominador por n?, en donde 


Q(n) 
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q es el grado de uno de los polinomios, de modo que una de las sucesiones 
(P(n)/n%) o (Q(n)/n%) tengan límite finito. Por ejemplo 


Ga) a) > 
b) Si (an) = (vn +4 — yn), se tiene 


E (Vn+4- Vn) (Vn+4+ yn) Vn +44 vn) - (+7) >0 
i Vn+4+ yn Vn+4+ yn 


se 
=z; | , teniendo en cuenta la propiedad del producto, se 
2n +3 


A a PENE 
n—>00 E n=>œ 2n + 3 F 2 16 


La siguiente propiedad es muy importante porque nos permite asegurar 
la existencia del límite de sucesiones. 





Existencia de límite de sucesiones monótonas acotadas. 


a) Una sucesión (an) monótona creciente y acotada superiormente es con- 
vergente. 

b) Una sucesión (an) monótona decreciente y acotada inferiormente es 
convergente. 


Demostración. 


a) Como (an) está acotada superiormente existe a = sup {an : n € N} 
(axioma del supremo). Probemos por la definición que a = lím an. 


n—>00 
Sea € > 0, como a es la menor cota superior de (an), existe Ny E N tal 
que a — € < An. Como (an) es creciente, entonces para todo n > ny se tiene 
An > ano. CON lo que 


da —E <d 0 SU AS O AO 


es decir |an — al < e. 
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b) Se razona de manera análoga a la de a). El 
6.3. Ejemplo. 


a) Recordemos que el número e, base de los logaritmos neperianos, se 


A” pa 
define como e = lím (1 -+ >) , ya que la sucesión (an) = (( + 5) ) es 
n 


n—>00 


monótona creciente y acotada y tiene límite. Además si (bn) > +00, entonces 


bn 
también se cumple que e = lím ( + =) . Véase el ejercicio 3. 
n—>00 n 





n? i 3n+2 
b) Teniendo en cuenta a), calculemos lím ( ) . Para ello debe- 
n> 


00 


bn 
mos poner la sucesión de la forma h + =) . Efectuando la división, se 
n 























tiene 
n2 q 2+? (G q y Bn+2 E 1 3n+2 
n? +n E —n+n P t a 
(n—1) 
Hacemos bn = — an y multiplicamos y dividimos el exponente 3n? + 2 por 
bn 
(Bn +2)% =p 3n +2 pto _Gn+2)(n+1) Da 
en donde 3 DM 1) 
m m e 
o A E e 
Por tanto 
.q S(n) lím S(n) 
2 1 3n+2 1 bn bn | n> 
lím (5 ) = lím (1+3) = | lím (+5) =e 
n>00 (nf +n n— oo n n—>>00 jA 





Dada una sucesión (a,) podemos considerar una nueva sucesión (s,) 
definida por la suma de sus términos 


Sı = 01, S2 = 41 + Q2, $3 = Q1 + Q2 + 03, ..... 157, == ag E. Ad Oj. 
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a la que denominamos serie y denotamos por >>; Un. Si (sn) tiene límite 
l, decimos que la serie es sumable o convergente y su suma es l, en caso 
contrario decimos que la serie es divergente. 

Si lím s, = l, entonces necesariamente mo An = 0, ya que 


n—>>00 


límia, =-lmis. 55), — limes Ll == 
n—>00 n—>00 n—>00 n—>00 
Naturalmente todas las propiedades de las sucesiones las podemos aplicar a 
las series. Por ejemplo si (sn) es monótona creciente o decreciente y está aco- 
tada, entonces (s,) tiene límite, es decir, la serie es sumable. 
Un ejemplo de serie sumable es la serie geométrica de razón menor que 
1. Sus términos están en progresión geométrica de razón r menor que uno, 


es decir (a) = (apr"=5) y 
y a T NM L ao o ar” 
"= r-l PEE ERA A? TE 


como lím +r” = 0 ya que lím r” = 0, resulta 
l=r 
n—00 n-—>00 


00 

7 01 
) Qn = ls = 
n—00 j-r 
n=l 





Otro ejemplo de series convergentes son las series telescópicas. Si existe 


m An = l y bn = An — An+1, entonces X >]; bn es convergente ya que Sn = 
Qi — Gn+1 y por tanto 


00 

> be = lus ia (a aa) == l 
1 NODO n—>00 

n= 


3. Funciones de una variable. Límites y con- 
tinuidad. 


Sea M un subconjunto no vacío de números reales, una función real de 
variable real es una aplicación f de M en R. A M se le llama dominio de 
la función a f(M) imagen de f y al conjunto de puntos del plano 
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Graff (x) =((x, y): y = f(z)) 
se le llama gráfica de f. 


Si la función f : M => f(M) es biyectiva, entonces existe una aplicación 
9: F(M) —> M tal que a cada f(x) le hace corresponder x. Esta aplicación 
se llama inversa de f y se representa por f”?. Es claro que la composición 
Fo f es la aplicación identidad en M y que fo f~? es la identidad en f(M). 


2: = Me=S/ Me]== 
y > uo] =y 


En numerosas ocasiones no se indicará explícitamente el dominio M de la 
función y se define f mediante una expresión o fórmula matemática, entonces 
supondremos que M es el conjunto de puntos de R en el que la fórmula tiene 
sentido, es decir está definida. 


3.1 Límite de una función. 


La idea intuitiva del concepto de límite que establecemos a continuación 
es clara: si un punto x del dominio se aproxima (tiende) a un punto fijo a, 
su imagen f(x) se aproxima (tiende) a un punto fijo b de R. Ahora bien, 
para que z Æ a se aproxime al punto a, en un entorno tan pequeño como 
queramos de a necesariamente tienen que existir puntos z del dominio M 
distintos de a, en otras palabras a tiene que ser un punto de acumulación de 
M, y así lo supondremos siempre. Consideramos una función f : M > R y 
un punto a € M”. 


Definición de límite. Se dice que b es el límite de f(x) cuando x tiende 
a a, y se escribe lím f(x) = b, si para todo e > 0 existe ô > O tal que si 
> 


0 < lx—al <ô se tiene |f(x) — b| < e. 


Si no existe confusión con el punto a al que tiende z, también escribiremos 
f(z) => bo bien lím f(x) = b. Las siguientes propiedades de los límites 
se demuestran de forma análoga a las propiedades correspondientes de los 
límites de una sucesión y se dejan como ejercicio. Supondremos que f y y 
son funciones de M en R y AER. 
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Propiedades de los límites. 
1. Si existe lím f(x) es único. 
z>a 
2. Si lím f(x) =b y lím g(x) = c, entonces lím [f(x) + g(x)] = b + c. 
za za zra 
3. Si lím f(x) =b entonces lím Af(x) = Ab. 
r>a za 
4. Si lím TaT límg(z) = ¢, entonces lím Pa) Se: 
5. Si g(x) # 0 para todo z € M, lím f(x) = iy lím g(x) =p, 
Fx) _b 


entonces lím == = -. 
z—>4u 


gle) c 
Si A es un subconjunto de M y a es un punto de acumulación de A (y por 
tanto también de M), podemos considerar el límite cuando z — a a través de 


los puntos x € A. Por ejemplo, si A = {z € M : x < a} el límite se representa 


por lím f(x)obien por lím f(x) y se dice que es el límite a la izquierda 
T—>a,r<a L>a7 


de f cuando zx tiende a a. De forma análoga, si A = {x € M:1>0) se 
tiene el límite a la derecha. lím f(x)o lím f(x). Estos límites se llaman 
T>a,T>4U a>a+ 
límites laterales. Si existe, como lím f(x) es único, entonces el límite de f 
i r>a 
a través de cualquier subconjunto A tiene que ser el mismo. 
Unos subconjuntos destacados de M son las sucesiones. La propiedad 


siguiente caracteriza la existencia del límite por sucesiones. Su mayor utilidad 
radica en que nos permite razonar en algunos casos la no existencia de límite. 


Caracterización del límite por sucesiones. Una condición necesaria 
y suficiente para que exista lím f(x) = b es que para toda sucesión (£n) de 
zta 


puntos de M distintos de a tal que (£n) —> a se tenga (f(£n)) > b. 
Demostración. 
La condición es necesaria. Supongamos que lím f(x) = by (£n) C M, £n £ 
zta 
a, tal que (£n) > a. Probemos que (f(x,)) > b. En efecto: dado £ > 0 por ser 
lím f(x) = b existe ô > 0 tal que si 0 < |x— a| < ô se tiene |f(x) —b] < e. 
r>a 
Por otro lado, como (zn) —> a, dado ô > 0 existe ny € N de modo que si 
n > ny se cumple 0 < |z, —a| < ô y por tanto |f(£n)— b| < e; es decir 


(H(tn)) > b. 
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La condición es suficiente. Razonemos por reducción al absurdo. Supon- 
gamos que no existe lím f(x) o bien que existe pero es distinto de b. En 
r>a 


cualquiera de los dos casos existe un entorno de b, o lo que es equivalente 
€ > 0 tal que para cada 4 = 1/n existe un punto £n de M que cumple 
0 < |£n — a| < 1/n de modo que |f (£n) — b| > £. Hemos construído así una 
sucesión (£n) de elementos de M, distintos de a, tal que (£n) > a y (f (£n)) 
no converge a b, lo que contradice la hipótesis. [J 


6.2. Ejemplos. 


a) La función f : R — R definida por f(x) =1x+3si0<zx<o00, f(0 
2, f(x) = x — 1 si —o0 < z < 0 no tiene límite en x = 0. Represéntese 
razónese porqué no tiene límite. 


)= 
y 


b) La función 
E O 
ds 


en x = 0 tiene límite a la izquierda 3 y a la derecha 1. Represéntese f y 
razónese porqué no tiene límite. 
c) Apliquemos el teorema de caracterización del límite por sucesiones para 


1 , 2 : 
demostrar que f(x) = sen —, x # 0 no tiene límite en z = 0. Las sucesiones 


1 1 
(tn) = (=) ES (7) convergen a 0, sin embargo 


lím f(t,) = lím sen27n=0 y lím f(t,) = lím sen (25m + =) =l 

n—00 n—>00 n—>00 n—00 2 
Obsérvese que x = 0 es un punto de acumulación del dominio M = R — {0} 
de la función f. 


Igual que en el caso de límites de sucesiones, el límite de una función 
puede ser +oo. La idea de las definiciones son análogas a las dadas entonces, 
es decir, miden el comportamiento de las imágenes f(x) cuando zx tiende a 
un determinado punto a, o x se hace tan grande como queramos , es decir x 
tiende a oo, o se hace tan pequeño como queramos, es decir x tiende a —oo. 
De este modo podemos establecer las siguientes definiciones: 


1. lím f(x) = œ si para todo k > 0 tan grande como queramos existe 
T>0 


ô >0 tal que si 0 < |x—al < ô se tiene f(x) >k. 
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Es claro que lím f(x) = —o0 si lím(—f(x)) = oo. 
zta T>0aO 
La recta xz =a se dice que es una asíntota vertical de la gráfica def. 


2. lím f(x) =b si para todo £ > 0 existe k > 0 tal que si x > k se tiene 


T>00 
f(x) —b| < e. De la misma manera lím f(x) =b si para todo e > 0 existe 
T—>—00 





k < 0 tal que si x < k se tiene | f(x) — b| < e. 
La recta y = b se dice que es una asíntota horizontal de la gráfica de 


f. 


En cualquiera de los casos en que x tienda a +00 o —oo, las imágenes 
f(x) pueden hacerse tan grandes o tan pequeñas como queramos, es decir, 
el límite de la función tiende a +00 o —oo. A continuación y a modo de 
ejemplo, establecemos la definición de uno de los casos. Los demás se dejan 
como ejercicio. 


3. lím f(x) =00 si para todo kı > 0 tan grande como queramos existe 
T—>—00 
ko < 0 tal que si x < ka se tiene f(x) > kı. 
A veces, los puntos de la gráfica de f(x) se van aproximando a un recta 
y = mz +b a medida que z tiende a co o —oo. En otras palabras la diferencia 
f(x) — (mz + b) tiende a cero cuando zx tiende a oo o —oo. Si la recta no es 


vertical, es decir si m % 0, decimos que la recta es una asíntota inclinada 
de la gráfica de f. 


Figura 1: Hipérbola xy = 1. 


6.3. Ejemplos. 
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1 
a) La gráfica de la función f(x) =—,x 4 0, es la hipérbola zry = 1. Es 
T 
claro que 


O. y „m f(z) =0, Mm) Ss am afr) = —oo 


T>-+00 z>0, 1>0 z—>0, x<0 
Nótese que el punto z = 0 es de acumulación de R — {0}, dominio de 


f. Además la recta z = 0 es una asíntota vertical y la recta y = 0 es una 
asíntota horizontal. 
p(z) 


b) Los límites de las funciones racionales f(s) = TE cuando zx tiende a 


+00 O —00 se calculan con la misma técnica que se emplea en las sucesiones 
cociente de dos polinomios en n, dividiendo por zê, en donde s es el grado de 
p(z) o q(x) de modo que uno de los cocientes tenga límite finito, y se aplican 
las propiedades de los límites. Por ejemplo 





Figura 2: Curva y = 


z3 
(2-1)(2+1) * 





pa A o EN 

z>00 5Bx2+1 e 200 5 + $ 5 

ss A e DL 
lm ———— = lím OS) 
00 ZT? +r+2 Tereon A 
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Nótese que la recta y = —2/5 es una asíntota horizontal de la gráfica de 
Me ba 

2 3 2 3 

y la recta y = 2x — 1 es una asíntota inclinada de f(x) = A 

+ x+2 
que 
7 P —] — 3x 
„ím [f(2) — (201) = E) y 


c) Si f es la función polinómica f(x) = x*, cuya gráfica es la cúbica 
y = 29, es muy sencillo probar por la definición que 


IR EI 


En una gran mayoría de casos, a pesar de conocer los límites de las funciones 


y 


Figura 3: Cúbica y = z3. 


que intervienen en la función cuyo límite queremos calcular, no podemos 
determinarlo por el simple hecho de que la operación no está definida. De 
esta manera aparecen expresiones como: 
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00 — 00; ES co x 0; 0. OO 
00 0 
y Otras análogas con el signo —, a las que denominamos indeterminaciones. 
Entonces, para resolver el límite tenemos que intentar deshacer la indetermi- 
nación aplicando operaciones elementales como la división o la racionalización 
de una fracción y propiedades de las funciones como la continuidad, tomar 
logaritmos, la regla de L'Hópital (que estudiaremos más adelante), etc. 


3.2. Continuidad. 


En caso de que a, además de ser un punto de acumulación, pertenezca 
al dominio M de la función, podemos preguntarnos si su imagen f(a) es el 
límite de f cuando x > a. Esto nos lleva al concepto de continuidad. 


Definición de función continua. Sea a € M, se dice que f es continua 
enasi 


lím f(z) = f(a) 


za 


Si f es continua en todos los puntos de M, se dice que f es continua en 
M. 





Figura 4: Continuidad. 
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En caso de que no exista el límite en a o sea diferente de f(a), decimos 
que la función es discontinua en a. Si existen los límites laterales pero son 
distintos, se dice que hay una discontinuidad salto. Si existe el límite b, 
pero es diferente de f(a) se dice que es una discontinuidad evitable porque 
podemos redefinir la función dando el valor ba f en a. 


Es obvio, como consecuencia inmediata de las propiedades de los límites, 
que se cumplen las propiedades análogas para las funciones continuas en 
un punto. De esta manera, si f y g son funciones continuas en a € M y 
AER, se tiene que las funciones suma f + g, producto f.g, producto por un 
número Af y cociente f/g, (g(x) 4 0 para todo x € M) son continuas en a. 
Naturalmente se cumple el teorema de caracterización por sucesiones: 

f es continua en a si y sólo si para toda sucesión (£n) de M convergente 
al punto a, la sucesión f(x.) converge a f(a) 

Además 

la composición de funciones continuas es una función continua 

(véase ejercicio 6). 

Otra propiedad importante es que las funciones continuas en un punto a 
conservan el signo de la imagen f(a) 4 0 en un entorno de a. 





Figura 5: Discontinuidades. 


Conservación del signo de las funciones continuas. Si f es continua 
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en a y f(a) 4 0, existe un intervalo (a — ôa + ô) en el que f(x) tiene el 
mismo signo que f(a). 


Demostración. Supongamos, por ejemplo, que f(a) > 0. Por ser f con- 


dai 
2 


tinua en a, dado € = > 0 existe ô > 0 tal que si |z — a| < ô se tiene 


f(a) 


If(x)— fla) < uN lo cual es equivalente a que 


RO < f(a) < fla) + 


si a—ô<xr<a+ô se cumple f(a) — 


Ha) 
2 


- es decir 


ea 


E 
con lo que f(x) > 0 para B x € (a—ô,a + ô), es decir, f(x) y f(a) tienen 
el mismo signo. 
f(a) 
2 


Si f(a) < 0, se considera e = — > 0 y se obtiene el resultado análogo. 


a 


Además de las propiedades anteriores de caracter local, es decir que se 
cumplen para un determinado punto a, existen propiedades globales, esto es 
propiedades que satisfacen las funciones continuas en un conjunto. Una de 
las más importantes es el teorema de Bolzano, que aplicaremos en diferen- 
tes situaciones y de forma singular en la aproximación de las raíces de una 
ecuación. 





Figura 6: Teorema de Bolzano. 


Teorema de Bolzano. Sea f : [a,b] +R continua en [a,b]. Si f(a) y 
f(b) tienen distinto signo, entonces existe un punto c del + ¡mln abierto 


(a,b) tal que f(c) =0 
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Demostración. Supongamos, por ejemplo, que f(a) < 0 y f(b) > 0. Sea 
S el subconjunto de los puntos de [a,b] tales que f(x) < 0. Es obvio que S 
es distinto del vacío ya que f(a) < 0 y a € S. Además S es acotado pues 
S C [a,b] y por tanto existe su supremo c. Probemos que f(c) = 0. 


En efecto, como sólo puede suceder que f(c) > 0, f(c) <0 o f(c) = 0, 
veamos que no se pueden cumplir los dos primeros casos y necesariamente 
tiene que ser f(c) = 0. 

i) Si f(c) > 0, por la propiedad de conservación del signo, existe un 
intervalo (c — 9,c + ô) ( o (c—Ó0,c] si c = b) en el que f(x) > 0, con lo 
cual c — ô sería una cota superior de S, pero como c— ĝ < c entonces c no 
podría ser el supremo de S y se llega a una contradicción. Luego no puede 
ser f(c) > 0. 

ii) Si f(c) < 0 el razonamiento es análogo al del caso anterior. Por la 
propiedad de conservación del signo, existe un intervalo (c — 06,c + ô) ( o 
[c,c + ô) si c = a) en el que f es negativa, y por tanto f(x) < 0 para algún 
xz >c lo que contradice que c sea una cota superior de S. Luego no puede 
ser flc)<0. El 

Es claro, tal como muestra la figura, que pueden existir muchos puntos 
del intervalo en los que se anula la función. La demostración del teorema 
prueba que existe al menos uno, y se ha considerado el mayor de todos ellos. 
Recordemos que un corolario de un teorema es un nuevo teorema que se 
obtiene como consecuencia del primero. El siguiente resultado se obtiene a 
partir del teorema de Bolzano 


Teorema del valor intermedio. Sea f continua en el intervalo [a,b], 
y sean zı, £2 dos puntos de [a,b] tales que zı < z2 y f(u1) # f(z2). La 
función f toma todos los valores intermedios entre f(x,) y f(x). 


Demostración. Supongamos, por ejemplo, que f(x,) < f(lxa) y k es un 
valor comprendido entre ambos. Consideremos la función g : [11,12] + R 
definida por g(x) = f(x) — k. Es claro que g es continua en [x1,x2] y que 


gan =f(01)-k<0 y glzo) = Fla) -k>0 


Por el teorema de Bolzano existe c € (£1, £2) tal que g(c) = 0, y por tanto 
Fc) —k=0, es decir f(c) =k. El 


Una función f : M — R se dice que alcanza su máximo absoluto 
en M si existe un punto c de M tal que f(x) < f(c) para todo z € M, 
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el número f(c) se llama máximo absoluto. De forma análoga, f alcanza su 
mínimo absoluto en M si existe un punto d de M tal que f(x) > f(d) para 
todo x € M, el número f(d) se llama mínimo absoluto. Pues bien, si f es 
continua en un intervalo cerrado [a,b], entonces alcanza su máximo absoluto 
y su mínimo absoluto en [a,b]. Para demostrarlo necesitamos antes probar 
que f está acotada en el intervalo, es decir que f(M) es acotado. 


Acotación de funciones continuas. Si f es continua en la, b], entonces 
f es acotada en [a,b]. 


Demostración. Probemos que existe un número k > 0 tal que |f(x)| < 
k para todo z € [a,b]. Supongamos que no es cierto y lleguemos a una 
contradicción. Sea c el punto medio de [a,b], como f no es acotada en [a, b] 
tampoco puede ser acotada en al menos uno de los subintervalos la, c] o fc, b] . 
Sea [a,,b,] uno de los subintervalos anteriores en los que f no es acotada y 
consideremos su punto medio cı, entonces f tampoco puede ser acotada en 
al menos uno de los subintervalos [a,,c,] o [c,,b1]. Sea faz, ba] uno de los 
subintervalos anteriores en los que f no es acotada y consideremos su punto 
medio cz. Repitiendo el proceso obtenemos una sucesión de intervalos [a,,, bn] 
en los que f no está acotada, tales que cada uno de ellos está contenido en 
el anterior 


fareb] Aaa AO t. 


y la longitud de [a,, bn] es la mitad de la longitud de [aņn-1, bn-1] de modo 
que se cumple 
b=a 
9n 

Por otra parte, la sucesión (a, ) está contenida en la, b] , con lo que está aco- 
tada y su supremo « pertenece al intervalo [a, b|. Como f es continua en q, 
dado e = 1 existe ô > 0 tal que si x € (a«—9,0. +0) se cumple | f(x) — a| < 1, 
con lo cual 


Dn — Un. = 


|[f(x)| <1+a para todo z € (œ — ô, a: + ô) 


Ahora bien, para n suficientemente grande de modo que (b—a)/2” sea menor 
que ô, el intervalo fap, bn] está contenido en (œ — 0,0. + ô) y por tanto f 
está acotada en [a,,, bn], lo que es una contradicción ya que hemos supuesto 
que no lo estaba. E] 
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Nótese que en la demostración anterior si o; fuese a, entonces el intervalo 
sería de la forma [a, a + ô), y si a fuese b sería de la forma (b — ô, b| . Además 
hubiésemos podido considerar las sucesiones (cn) o (bn) para hacer el mismo 
razonamiento. 


Teorema de los extremos absolutos (teorema de Weierstrass). Si 
f es continua en [a,b], entonces existen puntos c y d de [a,b] tales que f(c) 
es el máximo absoluto y f(d) es el mínimo absoluto de f en [a,b]. 


Demostración. Como f es acotada en [a,b], basta con probar que K = 
sup f(x) y k = ínf f(x) se alcanzan en el intervalo [a, b], con lo que nece- 
sariamente tienen que existir puntos c y d de [a,b] tales que f(c) = K y 
TO) = k; 

Supongamos que no existe x € la, b] tal que f(x) = K y llegamos a una 
contradicción. Consideremos en [a, b] la función g(x) = K — f(x), entonces 
g(x) > 0 para todo z del intervalo y la función 1/g está definida y es continua 
en [a,b], con lo cual es acotada y existe C > 0 tal que 1/g(x) < C para todo 
x € [a,b]. Por tanto 


leo + 
K - f(x) 


cualquiera que sea x de [a,b], lo que contradice que K sea el supremo de f, 
es decir la menor cota superior de f en [a,b]. 

Para razonar que k pertenece al intervalo, es suficiente con tener en cuenta 
que el ínfimo de f es el supremo de —f. Ll] 


<O=>1+ (0 < KC> f) <K- 5 


6.4. Ejemplos. 


a) Razonemos a partir de las propiedades de las funciones continuas que 
una función polinómica p(x) es continua en todo R. 

Por la definición de continuidad, la función identidad f(x) = x es conti- 
nua en cualquier punto de R, basta considerar ô = €. Por la propiedad del 
producto, cualquiera que sea m € N, la función g(x) = 1", producto de f 
por si misma m veces, es continua. La función monomio, producto de un 
número À por g, es decir h(x) = Ax” es continua. Como p(x) es la suma de 
un número finito de funciones monomios, entonces es continua. 

Aplicando la propiedad del cociente, las funciones racionales p(x)/q(7), 
cociente de dos polinomios, son continuas en el subconjunto M de R en el 
que no se anula el denominador q(x). 
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b) Probemos por la definición que f(x) = +y/x es continua en x > 0. Sea 
e > 0. Si zo = 0, basta considerar ô < e?. Si y > 0, como 


(VE—VRNVE+y[z0) _ 520 


Jl VE + y/o YI +y/Z0 


y por tanto 


e 
— |z — Zo] 


|væ -= y/zo| = 


basta considera ô < ,/ToE. 





1 
Mea 








c) Sea la función f(x) = 2*+x*—6x+2. Apliquemos el teorema de Bolzano 
para estudiar si la ecuación f(x) = 0 posee raíces reales en el intervalo [-4, 4] . 

1. Como f(-4) = -22 y f(4) = 58, existe al menos una raíz real en el 
intervalo.[—4, 4] . 


2. Consideremos los subintervalos [-4, 0] y [0,4], como f(0) = 2, una de 
las raíces está en [—4, 0]. 

3. Consideremos [—4, —2], [—2, 0] , [0, 2] y [2, 4], como f(—2) = 10 y f(2) = 
2, seguimos teniendo una raíz localizada en [-4, —2] . 

4. Consideremos [-4, —3] , [-3, —2] , [-2, —1] , [-1,0], [0, 1], [1,2], [2,3] y 
[3,4], como f(-3) = 2, f(—1) = 8, f(1) = -2 y f(3) = 15, una raíz se 
encuentra en [—4, —3], existe otra en [0, 1] y otra en [1, 2]. 

De esta manera hemos separado las raíces, es decir, hemos encontrado tres 
subintervalos en cada uno de los cuales se encuentra una raíz ( el polinomio es 
de grado tres y sólo puede tener tres raíces reales). Si quisieramos aproximar 
más las raíces, reiteraríamos el proceso en cada uno de los intervalos en que se 
encuentra la raíz. En el último tema estudiaremos la resolución aproximada 
de ecuaciones. 


A. Derivada de una función 


El concepto de derivada procede de la necesidad de resolver un pro- 
blema geométrico. En el siglo XVII, Pierre de Fermat, uno de los grandes 
matemáticos de la Historia, se propuso encontrar un método para averiguar 
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en que puntos una curva alcanza sus máximos y sus mínimos. Se dio cuenta 
que la tangente a la curva en esos puntos era una recta horizontal, con lo que 
el problema le condujo a una cuestión más general: determinar la dirección 
de la recta tangente en un punto arbitrario de la curva. 


Figura 7: Recta tangente. 


En la figura anterior hemos fijado un punto P de la curva y vemos como 
el límite de las rectas secantes que pasan por P es la recta tangente a la 
curva en P. Por tanto, la pendiente de la recta tangente es el límite de las 
pendientes de las rectas secantes cuando el punto Q tiende a P. Consideremos 
una función f: M —> R y un punto a de M. 


Definición de derivada. Se llama derivada de f en a y se representa 


por f'(a) 


z>40 JE — (04 


siempre que dicho límite exista. 


d 
La derivada también se suele denotar por Ea), y si hacemos z = a +h, 
g 
el límite anterior lo podemos escribir 
fla +h) - f(a) 
h 


f (a) = lím 
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A Af(a) = f(a+h)— f(a) se le llama incremento o variación de f cuando 
la variable z pasa de a a a + h. Al valor h se le llama incremento de x. La 
tasa de variación media de f en el intervalo viene dada por el cociente 
Af(a)/h, con lo que además de su significado geométrico como pendiente de 
la recta tangente en el punto, la derivada se puede interpretar como la tasa 
de variación instantánea de la función f en el punto a. Por ejemplo si 
s = s(t) es el espacio recorrido por un móvil en función del tiempo, la tasa 
de variación media en un intervalo de tiempo [t,,to] es la velocidad media 
desde s(t,) a s(to), y la tasa de variación instantánea en to es la velocidad 
que lleva el móvil en ese instante. 


Si una función es derivable en todos los puntos de su dominio M, a la 
función f’: M — R que a cada zx le hace corresponder f'(x) se le llama 
derivada primera de f. Si a su vez f’ es derivable en M, a su derivada 
f" se le llama derivada segunda de f. De esta manera se pueden definir 
las derivadas sucesivas f", f?,..., f7,...(tercera, cuarta, n-ésima). Una 
función que tiene derivadas continuas hasta el orden n se dice que es de 
clase n en el dominio M. 


A partir de los límites laterales se define la derivada a la derecha f”*(a) 
como el límite a la derecha y la derivada a la izquierda f^ (a) como límite 
a la izquierda de Af(a)/h. Es claro que f es derivable en a si y sólo si ambos 
límites son iguales. f'+(a) = f'(a). Por ejemplo la función valor absoluto 
f(x) = |x| no es derivable en z = 0 ya que f'(a) = —1 y f'*(a) = 1. Estas 
derivadas se llaman laterales. 


Como consecuencia de las propiedades de los límites se obtienen las 
propiedades y reglas elementales de cálculo para las derivadas. Su demostración 
se deja como ejercicio. Suponemos f y g dos funciones derivables en z y A € R. 


Propiedades de la derivada. 


1. Si existe, la derivada es única. 

2. Si una función es derivable en un punto es continua en él. 
3. (f+9) (2) = f(x) + 9 (2). 

4. (Af/(z) =AF (2). 
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5. (F9) (£) = fu)gz) + Ple)glz). 


6. Si g es distinta de cero en un entorno de x y g'(x) #0, entonces 


WN, gafa) fa) (x) 
5 = ga 


A modo de ejemplo, recordemos el cálculo de la derivada de algunas fun- 
ciones elementales. 


6.5. Ejemplos. 


a) Es obvio que la derivada de una función constante f es cero ya que 
fle +h) - fla) =0 

Como la derivada de f(x) = x es 1, aplicando la regla del producto, 
la derivada de g(x) = 1” es g'(x) = nx"? y la derivada de h(x) = kz” 
es h'(x) = knx""*. Como consecuencia la derivada de la función polinómica 
plz) =ar" Fanar +. Hayes (2) = ar” “FAA 


b) Teniendo en cuenta la igualdad trigonométrica 


EN A 3 £ 
2 2 








Q 
seno — senf = 2 cos 


la derivada de la función f(x) = seng viene dada por 











> e 3 EL O E A A 

AA h S e a a E 

lím cos | xz + a COS T 

= límce — = 
h0 27 02 
+ senh/2 _ 
ya que lím e k 
De manera análoga, teniendo en cuenta la igualadad 
cos q — cos p = T a 

se prueba que la derivada de f(x) = cosx es f'(x) = —senz. Aplicando las 


propiedades se obtienen las derivadas de las demás funciones trigonométricas. 
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c) La derivada de la función f(x) =1nx,x > 0, teniendo en cuenta las 
propiedades del logaritmo, resulta 





h>0 h>0 h 


y yan 1 
Le ¿A = tye T 
ln lím e) | Ine P 


Nótese que si h > 0, como z es fijo, x/h — oo, con lo cual el límite del 
corchete es el número e. 


=j i y 
o AS 2 
h ; £ h>0 T 


La composición de dos funciones derivables es derivable. Este resultado se 
conoce como Regla de la cadena y es fundamental en el cálculo de derivadas, 
pues la mayor parte de las funciones vienen definidas como composición de 
funciones elementales cuyas derivadas conocemos. 


Regla de la cadena. Sea f : M —> R derivable en a y g : F(M) > R 
derivable en b = f(a), entonces la composición go f : M —> R es derivable 
enay 


(g 0 f) (a) = g' [F (a)] F(a) 


Demostración. Tenemos que calcular el limite cuando h — 0 del cociente 


(go E aN _ g[f(a+»h)] — glf(a)] 
E h h 
y comprobar que es g' [f(a)] f(a). 
Sea k = f(a + h) — f(a) 4 0 (obsérvese que k depende de h) y hagamos 
f(a+h) =b + k con lo que 


(go f)(a+h)-— (g0 f)(a) _ g(b+k)—9g(0) _ g(b+ k) -— g(b) k 


h h w h 


Como por definición 


AB T 
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y 
k RS 
lí y lim 2D HO) — pr) 


se obtiene el resultado. 


Nótese que hemos supuesto que k % 0 en un entorno de a. En caso 
contrario la función f sería necesariamente constante y su derivada sería 
cero. Ll] 


Una consecuencia de la Regla de la cadena es la derivada de la función 
inversa. Si f es derivable en x € M y posee función inversa f7*derivable en 
y = f(x), como f~! o f es la identidad i(x) = z (1'(x) = 1), resulta 


= o (2) =P A) F (e) =1 
por tanto : 
11: UN 
o eS 
6.6. Ejemplos. 


a) Teniendo en cuenta la lerivada de la función logaritmo y la regla de 
la cadena, podemos calcular l derivada de la función exponencial f(x) = 


a”,a > 0. En efecto, ln f r =-~ ina. derivando ambos miembros 
a. Elna = f(x) = f(x) Ina 
fx 
Esta técnica de deri- =. tomando logaritmos y derivando los dos miem- 


bros de la igualdad res:1=a27e. se llama derivación logarítmica. En muchas 
ocasiones simplifica .2=- 1.10S 


b) La función f + ==>s*Inx*%,x > 1 es composición de cuatro funciones 
elementales 
— = —Inzx?* > cosln z? > (cos ln z’)? 


Aplicando la rez} - .. cadena, se obtiene 


f'(a) = 1012 )] [esen(tna?)] ES (0) = sen(2Ins”) 
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Se ha puesto entre paréntesis el punto en el que se va derivando cada función. 
Recuérdese que 2 sen a cos œ = sen 20 


Hemos definido antes los conceptos de máximo y mínimo absoluto de 
una función en un conjunto M. Consideramos ahora los conceptos relativos o 
locales, es decir, los máximos y mínimos de la función referidos a los entornos 
de los puntos y no a la totalidad de M. 





Figura 8: Extremos absolutos y relativos. 


Definición de extremos relativos. f : M > R tiene un máximo 
(mínimo) relativo en a € M si existe un entorno V de a tal que 


f(x) < fa) ( f(=) > fa) 
para todo x E€ V A M. 


Recordemos que precisamente fue la búsqueda de la condición que deben 
de cumplir estos puntos lo que llevó al concepto de derivada. Probemos que, 
efectivamente, la tangente en un extremo relativo es una recta horizontal o 
lo que es equivalente que la derivada de f en el punto es cero. 


Condición necesaria de extremo relativo. Supongamos que f está defini- 
da y es continua en un intervalo abierto I y que posee un máximo o un 
mínimo relativo en a € I. Si f es derivable en a, entonces f'(a) = 0. 
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Demostración. Supongamos que f tiene un máximo en a. Consideremos 
la función F : Z — R definida por 


E) = EDIO ista, Fla) = flo) 
TA 
F es continua en todo el intervalo / ya que si x % a es un cociente de 
funciones continuas cuyo denominador no se anula y si x = a, como f es 
derivable en a, lím F(x) = f'(a) = F(a). 
T—>0 


Si f'(a) > 0, entonces existe un entorno V C T de a en el que F(x) > 
O para todo x € V (propiedad de conservación del signo de las funciones 
continuas), con lo cual resulta que 


six > a, entonces f(x) > f(a) para todo z € V 
six < a, entonces f(x) < f(a) para todo z € V 


por tanto f no tiene un máximo en a, lo que contradice la hipótesis hecha. 


Si f'(a) < 0, entonces existe un entorno V C I de a en el que F(x) < 0 
para todo z € V, con lo cual resulta que 


six > a, entonces f(x) < f(a) para todo z € V 
six < a, entonces f(x) > f(a) para todo x € V 


por tanto f no tiene un máximo en a, lo que contradice la hipótesis hecha. 
Luego necesariamente f'(a) = 0. 


Si suponemos que f tiene un mínimo en a, entonces — f tiene un máximo 
y aplicamos a —f el razonamiento anterior. O 


De acuerdo con el resultado establecido, los posibles extremos relativos 
de una función derivable f son las soluciones de la ecuación f'(x) = 0. Sin 
embargo esta condición no es suficiente, la tangente a la curva y = z? en z = 0 
es horizontal y el punto no es un extremo. Más adelante, como aplicación del 
teorema de Taylor, probaremos una condición suficiente mediante la derivada 
segunda. 
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4.1 El teorema del valor medio. 


Antes de establecer el teorema del valor medio, cuya utilidad radica en 
que a partir de él se deducen muchas propiedades de las funciones derivables, 
entre ellas la Regla de L'Hópital y el teorema de Taylor, vamos a probar un 
caso particular que se conoce con el nombre de teorema de Rolle. 


Teorema de Rolle. Sea f continua en el intervalo cerrado [a,b] y deri- 
vable en el intervalo abierto (a,b). Si f(a) = f(b), entonces existe c E (a,b) 
tal que f(c) =0. 


Demostración. Razonemos por reducción al absurdo. Supongamos que 
f'(x) # 0 para todo x € (a,b). Como f es continua, alcanza su máximo 
absoluto K y su mínimo absoluto k en algún punto del intervalo cerrado (a, b]. 
Ahora bien, si los alcanzase en el intervalo abierto (a,b), por la condicion 
necesaria de extremo relativo, su derivada en esos puntos sería 0, lo que no 
puede ser ya que f'(x) Æ 0 para todo x € (a,b). Entonces f alcanza K y k 
en los extremos a y b del intervalo, pero como f(a) = f(b), resulta que el 
máximo y el mínimo coinciden, es decir, K = k, y la función f es constante. 
Por tanto f'(x) = 0 en todos los puntos de (a, b), lo que contradice la hipótesis 
hecha. C] 


Teorema del valor medio. Sea f continua en el intervalo cerrado |a, b] 
y derivable en el intervalo abierto (a,b). Entonces eriste por lo menos un 
punto c € (a,b) tal que | 


F(b) — f(a) = F(c)(b — a) 


Demostración. Aplicamos el teorema de Rolle a la función 


g(x) = f(x)(b — a) — z [F (b) — Fa) 


que está definida y es continua en |a, b] y derivable en (a,b). Además g(a) = 
g(b) = bf (a) — af (b). Por tanto existe c € (a,b) tal que g'(c) = 0, y resulta 


f(c)(b— a) — [F(0) — F(a)] =0 


que es lo que queríamos demostrar. E] 
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Figura 9: Teorema del valor medio. 


Como corolario del teorema podemos probar el siguiente resultado que 
utilizaremos más tarde en la demostración de la Regla de L*Hópital. 


Fórmula de Cauchy. Sean f y g continuas en el intervalo cerrado la, b] 
y derivables en el intervalo abierto (a,b). Entonces existe por lo menos un 
punto c € (a,b) tal que 


[g(b) — g(a)] F(c) =[f(b) — f(a)] gc) 
Demostración. La función 
h(x) = [9(b) — g(a)] f(x) — [f ©) — f(a)] g(z) 


cumple las hipótesis del teorema de Rolle ya que es continua en Ja, b] , deri- 
vable en (a,b) y 


h(a) = h(b) = f(a)g(b) — g(a) f (b) 
Por tanto existe un punto c € (a,b) tal que h'(c) = 0, es decir 
[9(b) — gla)] F'(c) — [f(0) — fla) g (e) =0 


lo cual teníamos que probar. El 
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Una función f : (a,b) —> R se dice que es creciente (estrictamente 
creciente) en (a,b) si para cualquier par de puntos £1, 12 € (a,b) tales que 
Tı < ma (21 < zo) se tiene f(x) < fla) ( f(zı) < f(x2)). De forma 
análoga, se dice que es decreciente (estrictamente decreciente) en (a, b) 
si para cualquier par de puntos %1, %2 E (a,b) tales que 11 > z2 (1, > 12) se 
tiene f(21) > f(z2) ( f(£1) > f(z2)). Las funciones crecientes o decrecientes 
se llaman monótonas. El siguiente resultado es un corolario inmediato del 
teorema del valor medio . 


Condición de monotonía estricta de una función. 
1. Si f'(x) > 0 para todo x € (a,b), entonces f es estrictamente creciente 
en (a,b). 


2. Si f'(x) < 0 para todo x € (a,b), entonces f es estrictamente decre- 
ciente en (a, b). 


3. Si f'(x) =0 para todo x € (a,b), entonces f es constante (a,b). 


Demostración. Supongamos f'(x) > 0. los demás casos se razonan igual. 
Por el teorema del valor medio, dados cualquier par de puntos x1, £2 € (a, b), 
tales que 2, < £2, existe x € (£1, £2) que cumple 


f(x) — f(x01) = f(x) (xo — 21) 
por tanto f(x2) > f(x1). O 


Si sustituimos los signos de desigualdad estricta por > y <, obtenemos 
los correspondientes resultados para función creciente y función decreciente. 


6.7. Ejemplos. 
a) Sea función f(x) = zt — 2x*. Consideramos los intervalos 


(oo, = (=i, 0), (0, 1) y (i 00), 


el signo de f'(x) es negativo en el primer intervalo y la función f es decre- 
ciente, positivo en el segundo y f es creciente, negativo en el tercero y f es 
decreciente, y positivo en el último y f vuelve a ser creciente. Esto nos per- 
mite afirmar que f alcanza un mínimo en x = —1, un máximo en x% =0 y un 
mínimo en g = 1. En esencia este es el razonamiento que hemos empleado en 
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la demostración de la condición necesaria de extremo relativo. Represéntese 
la función 


b) Veamos que la función f definida en el intervalo [—2, 2] por 
Ho) =x? +2r+1siz <1, fa) =x3+30six>1 


cumple las hipótesis del teorema del valor medio y calculemos los valores 
medios dados por el teorema. 
Como f viene definida por dos polinomios y lím f(x) = 4 = f (1), entonces 
T 


f es continua en [—2, 2]. Además es derivable en (—2, 1) y (1,2). Veamos que 
las derivadas laterales en x = 1 son iguales. Como f'(x) = 3122 +2 six <1 
y f(x) =2x+3 siz > 1, resulta 


I— 2 7 2 $. I+ E 4 em 
FO (1) = Mm 32 +2=5 y (1) = Um 20+3= 5 
luego f es derivable en x = 1 y por tanto lo es en todo el intervalo (—2, 2) 
En consecuencia cumple las hipótesis del teorema. 


La derivada de la función es positiva en todo el intervalo (—2,2) y la 
función es creciente. f(x) toma todos los valores entre —11 y 10. 


La siguiente aplicación del teorema del valor medio se conoce con el nom- 
bre de Regla de L’Hôpital y constituye una magnifica herramienta para el 
cálculo de límites. 


Regla de L’Hôpital. Sean f y g funciones derivables en un intervalo 
abierto (a,b),y g(x) 4 0 para todo x € (a,b). Supongamos un punto c del 
intervalo tal que f(c) = g(c) = 0 y g'(x) 4 0 para todo z € (a,b) — {c}. Si 


A entonces 


existe lím 
ac 9 (2)? 


mompa 


I=>cC g(x) te eE) 





Demostración. Sea x € (a,b) tal que c < x=. Las funciones f y g son 
continuas en |c, £] y derivables en (c, x). Por la fórmula del valor medio de 
Cauchy, existe £ € (c, x) tal que 


Fæ) = FOIF E) = igle) — g(c)] g'(E) 
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como f(c) = g(c) =0 y g(x) 40 para x +4 c, resulta 


1 IO O) 

[ONO =D +7 = 7 

tomando límite a la derecha, teniendo en cuenta que £ > c cuando x —> c ya 
quec<t<z 





PEL ESO 


T>C,T>C g(x) pa TC, T>C g'(x) 





Si consideramos ahora x € (a,b) tal que z < c. Razonando de la misma 
manera existe x < u < c y se llega a que el limite por la izquierda existe y 
es igual al límite por la derecha, es decir 


li qu ¿dla (o) 


TC, T<C g(x) >C, T<C 9 (x) 
Como consecuencia se cumple la tesis. O 


Nótese que si g'(c) = 0 y f'(c) 4 0, el límite es oo. Además el punto c 
puede ser uno de los extremos del intervalo, con lo cual se trataría de un límite 
lateral. Por otra parte, una versión un poco más general de la regla afirma 
su validez para el caso en que la indeterminación sea co/oo. Finalmente, 
también podemos calcular los límites que dan lugar a otras indeterminaciones 
transformando adecuadamente las funciones. Los ejemplos d) y e) siguientes 
son una muestra de ello. 


6.8. Ejemplos. 
Aplicamos la regla de L*Hópital para resolver los límites siguientes. 


a) 


sen T , COST 











lím = ]ím 1 
z>0 T 0 
b) 
atada 16 , 6r+2 14 
lim ————— = lím = 
TORR 2 z—2 2g — 1 3 
c) 
im MAA im (1 — aje? — e? e 


O rT T 6xrx— 1 5 
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d) 
1 1 2/3 
¡a fe ¡2 5) e a A 
100 Yx t>0 3/1 t01 cy E t>0 
7 SENE t2 
= lím3t—- = lím 344 = 0 
50  t2/ t>50 


e) El límite de la función f(x) = (1 — cosx)*%**”, en donde 1 — cosx > 
0, cuando x —> 0* conduce a una indeterminación del tipo 0%. Tomando 
logaritmos neperianos, consideramos la función g(x) = senxin(1 — cos 2). 
Como 
In(1 — cos z) 


g(x) = sen z ln(1 — cos z) = TE 


cuyo límite podemos determinar por la regla de L”Hópital. Teniendo en cuenta 
que 








d sen T d 1 COS £ 

2 o E E a a a 

dx —] + cosx dx sen z CASA 
resulta 

sen t 
i O o (1 —cos*x)senz e (1 + cos 2) sen z 

lím g(x) == lím —2 = lím += lím - 3 
20+ a+ — E ot (1 +c087)C080 sot cos £ 


or tanto lím f(x) = lím es) =e =1. 
P x= 0t F ) x—=0t 


5. El teorema de Taylor. Aplicaciones. 


Consideramos ahora una función f cuyas derivadas sucesivas existen en un 
entorno V de un punto a de su dominio. El problema que vamos a estudiar es 
la manera en qué podemos aproximar f en V mediante funciones polinómicas 
y cómo se puede medir esta aproximación, es decir, cuál es la cota de error 
que cometemos al sustituir f por el polinomio. El teorema de Taylor nos 
proporciona una de las diferentes técnicas de realizar esta aproximación. 
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Teorema de Taylor. Si f tiene derivada continua hasta la de orden 
n+1 en un intervalo abierto V que contiene a a, entonces para cada x € V 
eriste un punto c € (a,x) o c E€ (x,a) tal que 


n" n+1) 
ro LO y y 


(1-a)?+....+ 





f(x) = Ha) + Pla laa += a 


Demostración. Fijemos un punto x de V y supongamos que a < xv, el 
otro caso x < a se demuestra de la misma manera. Denotemos por P(t) el 
polinomio 


Ez ) 








P(t) = f(a) + Plat 0) + ta) + o... + 
(nótese que f(x) y P(x) son valores fijos). Consideremos el número K definido 
por 


f(x) = Pla) +K(2-ay* (1) 


y la función h : [a, £] —> R definida por 


h(t) = f(t) - P(t) - K(t-aJ* (2) 


Tenemos que probar que existe un punto c tal que a < c < x de modo que 
(m+1)!K = f”+D(c), con lo cual al sustituir el valor de K en (1) tenemos la 
expresión del enunciado. Como en a todas las derivadas de f(t) y P(t) son 
iguales, es decir, f} (a) = PP (a) para k = 0, 1,2, ..., n, resulta que 


h(a) = h'(a) = h” (a) =..... = h(a) = 0 


y por otro lado, teniendo en cuenta (1), es claro que h(x) = 0. 

Aplicando el teorema de Rolle a h en [a,x] existe cı € (a,x) tal que 
h!(c1) = 0. Como h'(a) = 0 y ?*(c,) = 0. Aplicando de nuevo el teorema 
de Rolle a h’ en fa, cı] existe c2 € (a,c1) tal que h'(cz) = 0. Reiterando el 
proceso, aplicamos el teorema a h” en el intervalo [a, cn], ya que A (a) =0 
y h™® (cn) = 0, y existe c € (a, cn) tal que h”+D(c) = 0.Por tanto de (2) 


O) 
(n 1)! 





0 = f(e) — K(n +1) > K = 
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que es lo que queríamos probar. E] 


Al polinomio 


J” (a) 


Po) (a 2a) FH t wy — a)” 


2! 





Pa (2) = f(a) + f'(a)(z — a) + 


se le llama polinomio de Taylor de orden n de f en a y se llama resto 
de Lagrange al término 
j RD (c) n+1 


Rayi (2) = 





(z — a) 


(n+ 1)! 





Figura 10: Aproximación de y = e” por los polinomios de Taylor. 


Obsérvese que para cada punto x existe un punto c para el que se satisface 
el teorema. Como consecuencia, si el teorema se cumple para cada punto de 
un intervalo |æ, £], en el que a € (a, $), el polinomio P, (1) aproxima a f(x) 
en [&, 8] con un error menor que una cota del resto R,,,1(1) ya que 


Fx) — Palx)] = [Ras (2)| 
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Si u es una cota de la derivada f”+1 en (a, 8), entonces 


H n+1 
|f(=) — Palz)| =|Rusr(x)] < Gin] e= al 


El teorema de Taylor de f en a es válido en cualquier intervalo abierto 
que contenga al punto en el que se cumplan sus hipótesis. . Por ejemplo si 
f(x) = |senz]| el intervalo de validez en el punto x = 1 es (0,00) ya que f no 
es derivable en x = 0. Si la función es de clase oo en un cierto intervalo (a, £) 
que contiene a a, es decir, es indefinidamente derivable en (a, 8), a cada f(x) 
le podemos asociar la serie 


1 Ea ay" 





que recibe el nombre de serie de Taylor. A la fórmula o desarrollo de f en el 
punto a = 0, se le llama fórmula o desarrollo de Mac-Laurin. 


6.9. Ejemplo. 


a) Sea f(x) = e7*?, como f(x) = (2) =.... = a) = Wa) = e7+? 
su polinomio de Taylor de orden 4 en x = 1 es 


a e a e 2, É 4 
P(r) =e +e (11) + (2-1) +g!) Hre- 1) 
y una cota del error cometido al sustituir f(x) por P4(x) en el intervalo [—3, 6] 
viene dada por 
o8 


e 
< S7 l6- (-3) = £9 





ger? 
! 


Te- 


|f (2) — Pa(2)| = |Rs(2)| = 








x+2 6+2 


Obsérvese que f(x) = e**? es una función creciente y et? < e 
todo z € [-3, 6]. 


Como la función es indefinidamente derivable en todo R, 


00 e3 
3 b l n 
de: es 
n= 


para 
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es su serie de Taylor. 


b) El desarrollo de la función f(x) = x? — x? + 1 en el punto z = 2 es 
válido en todo R y viene dado por 


Pla) =5+8 (2-2 +5(2- 2) + (a - 2 


Si operamos el polinomio y simplificamos obtenemos P(x) = f(x). El poli- 
nomio de Taylor de un polinomio coincide con él en cualquier punto que 
hagamos el desarrollo. 


La primera aplicación del teorema de Taylor es la condición suficiente de 
extremo relativo mediante el valor de las derivadas sucesivas de la función en 
el punto. 


Condición suficiente de extremo relativo. Sea f definida en un 
intervalo abierto I y a € I tal que f'(a) = 0. Si existe y es continua la 
derivada segunda f” en I, se cumple: 

1. Si f"(a) <0, entonces f tiene un máximo relativo en a. 

2. Si f"(a) > 0, entonces f tiene un mínimo relativo en a. 


Demostración. Supongamos que f”(a) < 0. Como f” es continua en a, 
existe un entorno, que podemos considerar el propio intervalo J, en el que 
f"(x) < 0 para todo x € I. Por el teorema de Taylor, teniendo en cuenta que 
f'(a) = 0, resulta 





en donde c € I. 





par todo x € I y a es un máximo relativo. 
Si f"(a) > 0, la demostración de que a es un mínimo relativo es igual 
cambiando los signos. C 


Un razonamiento idéntico al anterior nos permite afirmar que si f tiene 
derivadas continuas en I hasta el orden n y fP(a) = 0 para todo k = 
1.2,...,n— 1, siendo f(a) 40 y n par, se cumple: 

1. Si Ff(a) < 0, entonces a es un mázimo realivo. 

2. Si f(a) > 0, entonces a es un mínimo relativo. 
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6.10. Ejemplos. 


a) Los posibles extremos relativos de la función f(x) = 1* — 2x* son las 
soluciones z = —1, z = 0 y z = 1 de la ecuación f'(x) = 4r’ — 4x = 0. Como 
Fx) = 127? — 4, resulta f”(—1) = 8, f”(0) = —4 y f” (1) = 8, con lo cual 
—1 y 1 son mínimos y O es máximo. Represéntese la función. 

b) Los posibles extremos relativos de la función f(x) = r(Inx)?, z > 0 
son las soluciones de (In x)? + 21nx = 0. La única solución posible es x = 1. 


Como f"(x) = „mr + 1), resulta f”(1) = 2 > 0 y x = 1 es un mínimo. 


c) Sea f(x) = 3 — (x + 2)*. Su derivada primera sólo se anula en el punto 
xr = —2. La primera derivada que no se anula en el punto es la de orden 
cuatro f} (x) = —24 y z = —2 es máximo local. 

d) En la función f(x) = 3—(x+2)*, la derivada f'(x) se anula en z = —2, 
pero la primera derivada que no se anula en el punto es f% impar, por tanto 
x = —2 no es extremo local. 


5.1 Convexidad. Puntos de inflexión 


Los conceptos de convexidad y concavidad dan lugar a dos importantes 
clases de funciones, cuyas propiedades hacen que sean muy utilizadas en 
los problemas de economía e ingeniería. Comenzamos con la definición de 
conjunto covexo. 


Un conjunto D del plano es convexo si el segmento que une dos puntos 
cualesquiera (x1, y1), (12, Ya) € D está contenido en D. Como los puntos del 
segmento vienen determinados por 


(2), y(M)) = Aur, y1) + (1 — A)(z2, ya) para À € [0,1] 
esto significa que el punto (Ax, +(1—A)12, Ay +(1—A)y2) € D cualquiera que 
sea el valor de A € [0, 1] . Es obvio que (x(0), y(0)) = (21, y1) y (x(1), y(1)) = 
(£2, Ya) 


Definición de función convexa. Se dice que f es convexa (resp. cónca- 
va) en |a, p] si para dos puntos cualesquiera x1,x2 de la, p] se cumple que 


far + (1 A)z2)) < Aflz1) + (1 — A) f (22) 
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(resp. F(Axi + (1— A)z2)) > Af (z1) + (1 — A) f (z2)) para todo A € [0,1]. 
Esta definición es equivalente a decir que el conjunto 


D=((2,y) ER”: y > f(x)) 


(resp. D' = {(x,y) € R? : y < f(x))) es convexo. Como consecuencia los pun- 
tos del segmento [(x,, y1), (22, Y2)] de D se encuentran por encima (resp. por 
debajo) de la gráfica de f, es decir de la curva y = f(x). 

Supongamos a partir de aquí que f es derivable en (a, 8). Entonces, si f 
es convexa, la tangente y = f(a) + f'(a)(x — a) a la curva y = f(x) en el 
punto a € (a, 8) está por debajo de la curva, y si f es cóncava por encima. 


Caracterización de las funciones convexas. La condición necesaria y 
suficiente para que f sea convexa en (a, B) es que su derivada f' sea creciente 


en (a, b). 
Demostración. Supongamos que f es convexa. Sean z1, 2, £2 E (a, B) tales 
que 1, < z < za, entonces la función 


p(z) = T - a hz 


es creciente. En efecto si y, = f(x1), y2 = f (£2) e y = f(z) + f'(z)(£ — z), 
por ser f convexa, la recta tangente a la curva en z = z se encuentra por 
debajo de su gráfica y se tiene 


osca a A a aA fur) — Hz) > Ple)la — 2) 
voy = fíto)-f(2)- flo) >0> f(z2) — f(2) > l 
como zı — Z < 0 y 23 — z > 0, resulta que 
es decir, si 11 < T2 
plz) < f (2) < plza) 
Como consecuencia de ser f derivable en todos los puntos del intervalo 
Fl) — £(2) fla) — He) 


AS A A fl) 


2>11 Liz Z> T2 LI Z 
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y f' es creciente. 


Reciprocamente. Supongamos que f’ es creciente en (a, 8). Sean z1, £2 € 
la 0). con ri < tna y OLAI Si 


£ = AD + (1 == A)Z2 


y aplicamos el teorema del valor medio a f en los intervalos [x,,x] y [x, xa], 
se tiene 


Hai) = fla)+f'(c1)N(x1 — zx) en donde zı < cı <x 
f(z2) = f(x) + f'(c2)(£2— x) en donde g£ < cz < Za 


Multiplicamos la primera igualdad por A, la segunda por (1 — A) y las 
sumamos. Como x = Az, + (1 — A)x2, teniendo en cuenta que 


zı — Ax — (1 — Aza = —(1 — A) (z2 — 21) 
Tao T = £ — Axı — (1 — Axa = Aa — 21) 


IRA 


resulta 


aja alarm (e) le 2] 
HA == —a le) Fteanl 


Ahora bien z3 — zı > 0, y por ser la derivada creciente, como Ca > C1, Se 
tiene f'(c2) — f'(c1) > 0. Como consecuencia 


Af (x1) + (1 — A) f (22) 


Af (x1) + (1 A) f(x2) > Hz) = Fr: + (1 — Aza) 
y la función es convexa. Ll] 


De forma análoga se demuestra que f es cóncava si y sólo si f' es de- 
creciente en (a, ß). Obsérvese que si una función g es convexa, entonces 
—g es cóncava, con lo cual a partir de una propiedad de la función convexa 
(o cóncava) se razona la propiedad correspondiente de la función cóncava (o 
convexa) sin necesidad de repetir una demostración análoga. 


Como consecuencia inmediata del resultado anterior se obtiene una nueva 
caracterización de la convexidad en caso de que f sea dos veces derivable. 
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Criterio de convexidad mediante la derivada segunda. Si la fun- 
ción f tiene derivada segunda. 

a) Si f"(x) > 0 en (a, B), entonces f es conveza. 

b) Si f”(x) < 0 en (a, B), entonces f es concava. 


Demostración. Si f”(x) > 0, en (a, 8), entonces f’ es creciente (ya que 
f” es la derivada de f’) y por tanto es convexa. El] 


Si f(x) <0 en (a,b), entonces f es cóncava. En efecto, —f"(x2) > 0, 
entonces — f’ es creciente y por tanto — f es convexa con lo que f es cóncava. 


Un punto en el que una función pasa de ser cóncava a convexa O viceversa, 
se llama punto de inflexión. Por tanto los puntos de inflexión determinan 
los intervalos de convexidad, es decir los intervalos en los que la función 
es cóncava O convexa. 


Caracterización de los puntos de inflexión. Sea a € (a, B) y supon- 
gamos que f es n veces continuamente derivable en (a, B) tal que fW(a) =0 
para todo 2 < k < n. La condición necesaria y suficiente para que a sea un 
punto de inflerión de f es que n sea impar. 


Demostración. Supongamos que n es impar. Como la derivada n—ésima 
f” es continua en a, existe un entorno (a—ô, a+0) en el f(x) tiene el mismo 
signo que f”)(a). Consideremos que f(a) > 0 (si fW(a) < 0 razonaríamos 
de la misma forma). Sea x € (a — 0, a + ô), aplicando el teorema de Taylor 


plo) 


n! 





(z — a)” 


en donde c € (a — ô,a + ô) y por tanto f™ (ec) > 0, con lo cual 


f(x) = f(a) + (az — a) + 





n) c 
f(x) Ma) = f'(a) -a) = LU ay>0 si r>a 
Ma o p 3 a~ fe) an : 
FHx)—$fla)- flalx—a) = e (ra) <0 si <a 


Como consecuencia, la tangente y = f(a) + f'(aJ(x— a) en a está por debajo 
de y = f(x) si x > a y la función es convexa y está por encima si x < a y la 
función es cóncava. Luego a es un punto de inflexión. 


Recíprocamente. Supongamos que a es un punto de inflexión y razonemos 
por reducción al absurdo. Si la primera derivada que no se anula es par, y 





Funciones reales de una variable real 183 


por ejemplo f™ (a) > 0, existe un intervalo (a— ô, a +ô) en el que f™ (x) >0. 
Como (z — a)” > 0 cualquiera que sea x € (a — 0, a + ô) y fc) >0, por la 
fórmula de Taylor se cumple 


f(x) — fla) — fa) — a) > 0 
con lo cual la tangente está por debajo y f es convexa. LJ] 


En resumen, para determinar los puntos de inflexión resolvemos la ecuación 
f"(x) = 0. Si a es una solución y la primera derivada que no se anula en a 
es impar, entonces se trata de punto de inflexión. 


6.11. Ejemplos. 


a) f(x) = sen z es cóncava en [0, 71] y convexa en [7,27]. El punto z = 7 
es de inflexión. 


b) f(x) = 2? + 2? + 4x +1 tiene un punto de inflexión en x = —1/3 ya 
que f”(-1/3) = 0. En (-oo, —1/3) la derivada f”(x) = 6x + 2 < 0, luego la 
función es cóncava y en (—1/3,00) la derivada f”(x) > 0 luego es convexa. 
Represéntese la función. 


AS 2402 x Æ 0. No tiene puntos de inflexión ya que f”(x) = 
—% = 0 no tiene soluciones. Como f”(x) > 0 en (00,0) es convexa en ese 
intervalo y es cóncava en (0,00) ya que f”(x) < 0. Represéntese la función 
(téngase en cuenta que y = x + 1 es una asíntota inclinada, pues se cumple 
que Mm [F) —-=—1]=0y A [f(x)— x -— 1] = 0 y z = 0 una asíntota 


vertical). 
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Ejercicios y cuestiones propuestos 


1. Respóndase a las siguientes cuestiones: 
a) ¿Cuál es el témino general de las sucesiones 


li T f2 5 10 17 26 37 m 
DAS AO 
b) Si l < an < bn y lím by =1, ¿es cierto qué lím a, =T. 
n—>00 n—>00 
c) Pruébese que si bn = lan| y lím a, = l, entonces lím bp, = |l]. ¿Es 
n— oo n—> oo 
cierto qué si lím b, = |l], entonces lím an = 1? 
n— o0 n00 
d) Pónganse ejemplos para probar en cada uno de los casos que aunque 


. ? 2 ? a . . . 7 
existan lím (an +bn), lím and, y lím — no tiene porque existir lím an y 
n—>00 n= n>00 b n—>00 


co Un 
lím bp. 
n—>00 
e) Sea (an) una sucesión que cumple, a, = 0, an-1 = Van +2. ¿ Es (an) 


una sucesión creciente”, ¿está acotada superiormente?, en caso afirmativo, 
¿es 2 una cota superior?. 


2. Calcúlense, si existen, los límites de las sucesiones 








n n+1 
3 n+1 om 
b) E 
GEE (=) 


f) Vn? + 2n? — Vn? + 1 
aa 
E) (3) 


1+2 y 
» ( E Zaa =) 





n2 
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| 1 i 1 
y € =D a O 5) 


n 


3. Sea la sucesión (an) = (1 + - 

a) Pruébese que (an) es monótona creciente y acotada. (Por tanto posee 
límite al cual llamamos número e). 

b) Pruébese del mismo modo que (af) = ( — z) y es monótona creciente 
y acotada. 

c) Pruébese que (an) y (a;,) tienen el mismo límite. 


d) De la misma manera que en a), b) y c), razónese que si (bn) —> 00, 
bn 


Rin oe 
e) Determínense los límites de ( ) y (==) 


e 
entonces lím | 1+ — =e. 
n— o0 





n2? +3 n? 
Indicaciones: 


1 n 
a) Desarróllese por el binomio de Newton el término (i + z) y véase 


1 n+1 
que es menor que ( + =) y que cualquiera que sea n la sucesión 


” 2 1 4 
está acotada por 3. (Análogamente para ( — z) 0 
n 
Para c) razónese que (an) — (a;,) = (a, — q;,) tiene límite 0. 
Para d) tengase en cuenta que todas las subsucesiones de (b,,) convergen 
a oo y podemos considerar una subsucesión creciente. 


4. Detemínense, en su caso, la suma de las series : 
5 
00 


1 
b) da A 
c) 1 — a +a? — aè + .... + (—1)%a” + ....en donde |a| < 1 


Eo 1 
d) is n(n+1) 
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DEE 
e) E 


n=1 yn(n +1) 
p ye 2n*—1 


n= gpa 





4. Determínense los límites de las funciones 

Ea ae EE 
a) ím ————— 
200 5x0 + 1 
a aa 
an 

e a 

c) ím = 

z>- %3 +g +11 


x—>0 q? 
y encuéntrense las asíntotas de las funciones en caso de que existan. 


1 1 
5. Pruébese que las funciones f(x) = cos Te #0 y g(x) = x? +sen —, x Æ 
£ 
O no tienen límite en x = 0. 


6. Si f : M —>R es continua en a € M y g : S > R es continua en 
b € f(M) C S, pruébese que la composición go f : M > R es continua en a. 


7. Respóndase a las siguientes cuestiones: 
a) ¿Qué clase de discontinuidad tiene en x = 0 la función 


fa) =z? — El SAO O =I0N: 
aaa 
zll 
b) ¿Es evitable la discontiunidad de f(x) = == six i 


f(=) =0. 

c) Demuéstrese por la definición que f(x) = x? es continua en R. 

d) ¿Se cortan en algún punto las gráficas de f(x) = 2% +x y g(x) = 
2 — cos z?. 

e) En el intervalo [0,2] qué hipótesis del teorema de Bolzano no cumple 


1 
la función Fx) = ¿(142 +3) E 7 < 1, A =e i Tean 


3 


Funciones reales de una variable real 187 


f) Determine dos funciones que no sean continuas en un punto y que su 
suma si lo sea. 

g) ¿Posee alguna raíz real la ecuación cosx — 3x + 1 = 07. 

h) ¿Posee alguna raíz real la ecuación 1% + x + 1 = 0?. 


8. La función polinómica p(x) = 2x* — 14x? + 14x — 1 se anula en cuatro 
puntos diferentes de R. Determinense cuatro intervalos conteniendo cada uno 
de ellos a una raíz. 


9. Determinar mediante la definición las derivadas de las siguientes fun- 
ciones: 


a) f(1) = 

b) f(x) = APA 

c) f(x) = cosx 
Í 


(== 040 


10. Aplíquense las propiedades de la derivada para calcular las derivadas 
de las siguientes funciones: 
E) o aaO 


Di) arecos yt, T> U 
Ate lc 2 <x<r/2 
d) f(x) = ln arcsen yz en z = 1/2 
e) f(x) = arctag (sen? (cos 2)) 
f) f(x) = tag (27 n2?) 
O kB 2 

V1+sen? g 
h) M0) =m 7 2,0<0<e 


IE = Yi EYES > —1 


11. Determínense los intervalos de crecimiento y decrecimiento de las 
funciones: 
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a) AE 4217502 db) 10) = 57. TEF 
c) f(x) = sen z + cosg diia e ser? 


12. Calcúlense los siguientes límites aplicando la regla de L”Hópital: 
,  TSENT 

a) ím ——— 
20 1 — cos x 


dl, 


et — er 


b) im 3tagz 


A at + 22% — 27? — 3x +2 
-m CA 


z 


7 B. , 1/x a 
d) lím qa COST e) lím (3 l)z 


f) lím (cos x?)1=cos a”) 
T—>00 


X 1 tagg 
8) lím (2) 
h) tagz — 2 


ím - ———— 
a>"/2 sec x — 1 
PE 1 1 
1) lím (— — 1) 
1>0Xsenz zT 
„~, Incos2z 
j as 
0 X 


13. Detemínense la expresión de los polinomios en función de las potencias 
(x — a) que se indican. 

a) p(x1)=x34+2102—x+1 en (2+1) —b)p(2)=21%*-3x2*+x en 
(z= 2) 


14. Determínese el polinomio de Taylor de orden cuatro de la función 
f(x) = sen z — cos 2x en un entorno de x = 0 y hállese una cota del error en 
el intervalo [—1, 1]. 


15. Utilizar el desarrollo de Taylor para calcular los valores de e y v3 con 
un error menor que 0, 01. 
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16. Determinar las series de Taylor de las funciones siguientes mediante 
su desarrollo en g = 0.: 
a) J (T) =c 


aa) ecosz 
d) f(x) =arctagz 
e) f(x) = ln(z? +1). 


17. Hállense los extremos relativos, los intervalos de crecimiento, los pun- 
tos de inflexión y los intervalos de convexidad de las funciones: 


a) fa) = Je — ja? 


c) y = e” (senz + cos 2) 
d) f(x) = sen? z 

e) f(a) = E 

f) f(x) = r—arctagz 
alt 
h) f(x) = 2z + 3Yx?2 


¿Cuánto vale el máximo y el mínimo absoluto que alcanzan las funciones 
a), e), £) y h) en el intervalo [—1, 1] y las funciones c) y d) en [0, 27]?. 


18. Representar las gráficas de las funciones de los ejercicios 9 , 11 y 13. 


19. Se desea construir un envase de forma cilíndrica y área 54 cm?. 
Calcúlense el radio y la altura del cilindro para que su capacidad sea máxima. 


20. Determinar la ecuación de la recta que pasa por (2,3) y forma un 
triángulo de área máxima con los ejes. 


21. Calcúlese el área del círculo máximo interior al recinto y > x2?, x > y?. 
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22. En una esfera de radio r, ¿cuál es el volumen del cono de mayor 
volumen que se puede inscribir?. 


23. Una pieza rectangular de cartón tiene 20 y 30 cm de lados. En cada 
una de sus esquinas se corta un cuadrado de lado para fabricar una caja. 
¿Qué valor tiene que tener x para que la caja tenga la máxima capacidad”. 





Capítulo 7 
La integral de Riemann 


1. Introducción y objetivos. 


Una función F es una primitiva de f si su derivada F” es igual a f. 
Al conjunto de primitivas de f se le llama integral indefinida de f y se 
representa por f f(x)dx. En este sentido la integración es el proceso inverso a 
la derivación. El lector ya tiene práctica en el cálculo de integrales indefinidas 
y sin duda alguna conoce los métodos de integración más habituales. En el 
último apartado y a modo de breve recordatorio expondremos algunos. Sin 
embargo, el objeto del capítulo es el estudio de la integral definida. 


La idea surge de la necesidad de calcular áreas de recintos planos limi- 
tados por curvas. Los matemáticos griegos abordaron el problema a través 
del método de exhaución, consistente en inscribir y circunscribir en el 
recinto regiones poligonales cada vez más cercanas a las curvas, de modo que 
sus áreas se van aproximando a la que deseamos calcular. Arquímedes fue el 
primero en utilizarlo y determinó el área del círculo inscribiendo y circuns- 
cribiendo polígonos regulares en la circunferencia. Obtuvo así dos sucesiones 
cuyos límites son en ambos casos el área del círculo. 


El desarrollo de la matemática de aquella época sólo permitió aplicar el 
método de exhaución a figuras muy regulares y, aunque Leibnitz y Newton 
lo impulsaron, el concepto de integral definida lo establece por primera vez 
Cauchy, para funciones continuas, a principios del siglo XIX. Unos años más 
tarde Riemann extendería la definición a una clase más amplia de funciones 
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que Lebesgue caracterizó mediante su celebrado teorema. En este contexto 
el resultado lo podríamos enunciar así: 


“una función es integrable en un intervalo si y sólo si el conjunto de sus 
puntos de discontiunuidad tiene longitud cero” 


Consideremos una función real f definida y acotada en un intervalo [a, b]. 
Recordemos que f es acotada en un subcojunto A de su dominio de definición 
si F(A) CR está acotado. Supongamos que la gráfica de la curva y = f(x) 
está por encima del eje Ox. Queremos calcular el área del recinto limitado 
por la curva, el eje Ox y las rectas x = a y x = b. Si añadimos a a y b una 
colección finita de puntos {t;} del intervalo, quedan determinados dos clases 
de rectángulos mediante los puntos de intersección de las rectas verticales 
x = t; con la curva. Una clase tiene uno de sus lados paralelos al eje Ox por 
encima de la curva y la otra los tiene por debajo. La suma de las áreas de los 
rectángulos de la primera clase, suma superior de Riemann, aproxima supe- 
riormente al área buscada y la suma de las áreas de los rectángulos de la otra 
clase, suma inferior de Riemann, la aproxima inferiormente. Cuantos más 
puntos consideremos en la colección, el error que cometemos va disminuyen- 
do. Si consideramos todas las posibles colecciones finitas de puntos, el ínfimo 





Figura 1: Sumas superiores e inferiores. 


de todas las sumas superiores coincidirá con el supremo de todas las sumas 
inferiores y ambas con el área del recinto. (Véase la Figura 1). A este valor 
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común m llamamos integral de Riemann de f en |a, b] y lo representamos por 
f Pe l 

a A parte, al hablar de supremo e ínfimo estamos implícitamente 
refiriéndonos al concepto de límite y la integral puede expresarse mediante 
un límite, cuestión a la que ya nos referimos en el capítulo anterior. Ésto 
será el contenido del tercer apartado. 


A partir de la integral y suponiendo variable en el intervalo [a,b] el ex- 
tremo superior de la integral, obtenemos una nueva función 


De E |: 0d 


que nos va a permitir demostrar los dos teoremas fundamentales del cálculo 
integral. El primero nos asegura que si f es continua entonces F es derivable, 
o en otras palabras / es una primitiva de f. El segundo nos proporciona una 
regla para calcular la integral de f en [a,b] si conocemos una primitiva F 
de f, puesto que 


b 
/ f(t)dt = F(b) — F(a) 


Recordemos que en los puntos a y b extremos del intervalo nos referimos 
a las derivadas laterales, cuando hablamos de la derivada de f en [a,b]. 
Aunque esto es superfluo si el dominio de f puede prolongarse a un intervalo 
que contenga estrictamente [a,b] en el que f sea derivable. 


La demostración de algunos teoremas se sale del propósito de este libro. 
El lector interesado puede verla en [11]. 


1.1 Objetivos. 


1. Determinar la integral definida de funciones sencillas mediante la defini- 
ción. 
2. Aplicar la condición de Riemann para estudiar la integrabilidad. 


3. Aplicar el teorema de Lebesgue para estudiar la integrabilidad. 
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4. Aplicar las propiedades de la integral para expresarla mediante inte- 
grales más sencillas. 


5. Calcular integrales mediante sucesiones y viceversa. 

6. Acotar integrales utilizando el teorema del valor medio. 

7. Utilizar la regla de Barrow para calcular el valor de integrales definidas. 
8. Determinar primitivas. 


9. Aplicar la integral al cálculo de áreas. 


2. Definición y propiedades de la integral. 


Sea f una función real definida y acotada en un intervalo 7 = [a,b] . Una 
partición P del intervalo 7 es una colección finita de puntos de 7 que incluye 
los puntos extremos a y b del intervalo, es decir 


PS ía = to, t1, t2, a das nes UA = b} 


es claro que una partición P de n + 1 puntos determina una colección de n 
subintervalos de la forma [t;—1,t;] , i = 1,2, ..., n, cada uno de los cuales tiene 
longitud |t; — t;_,|. Como f es acotada en T, existe su supremo y su ínfimo 
en cada uno de lo subintervalos. Si designamos por 


M; = sup {f(t ir AS ti} y mi = inf 510) E ti} 


se llama suma superior de Riemann de f respecto a la partición P y se 
representa por S(f, P) al número 


S a YM- til 


y análogamente se llama suma inferior de Riemann de f respecto a la 
partición P y se representa por s(f, P) al número 


s(f, P) = Dr shal 
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Como |b— a| es la longitud del intervalo I, si M y m son respectivamente 
el supremo y el ínfimo de f en todo el intervalo /, cualquiera que sea la 
partición P que consideremos es obvio que se cumple: 


m|b— a] < s(f, P) < S(f, P) < M |b- al 


es decir, el conjunto de todas las sumas inferiores y el conjunto de todas las 
sumas superiores de Riemann están acotadas y por tanto ambos conjuntos 
tienen supremo e ínfimo. 


Denotemos por P al conjunto de todas las posibles particiones P del 
intervalo fa, b]. Se llama integral inferior de Riemann de f en [a,b], y se 
representa i lo. f , al supremo de las sumas inferiores, es decir 

la, 


f  t=swts(t.P): PeP) 
Lía 


y se llama integral integral superior de Riemann de f en [a,b], y se 
representa por f lad] f , al ínfimo de las sumas superiores 


== EA 
[a,b] 


Es claro que las integrales superior e inferior existen siempre, ya que los 
conjuntos de las sumas están acotados, aunque en general no tienen porque 
ser iguales. 


Definición de la integral de Riemann. La función f es integrable 
Riemann en [a,b] si sus integrales inferior y superior son iguales 


J ys Moda 
[a,b] [a,b] 


A este valor se le llama integral de Riemann de f en [a,b] y se representa 
por dto y f 0 bien Cree 


La función f se denomina integrando, el intervalo [a,b] intervalo de 
integración y los valores a y b límites de integración. 
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7.1. Ejemplos. 


a) La función constante f(x) = k es integrable en cualquier intervalo, ya 
que si P es una partición cualquiera de fa, b], se tiene 


1=1 i=l 


s(f, PYE Y milti — tia] S e ti] =k|b— dl 
=l 


¿=1 


Luego todas las sumas son constantes y las integrales superior e inferior valen 
k |b— a]. 


b) La función f(x) =0 si x es racional y f(x) = 1 si æ es irracional, no 
es integrable en el intervalo [a, b]. En efecto, como en cualquier subintervalo 
[t¿-1, ti] de cualquier partición P hay puntos racionales e irracionales, M; = 1 
y m; = 0, con lo cual S(f, P) =1 y s(f, P) =0 y resulta 


ji Su " Pee 
[a,b] [a,b] 


La condición siguiente caracteriza las funciones integrables. Obsérvese que 
por la definición de supremo e ínfimo de un conjunto de números reales, si 
€ > 0, existe una partición P tal que 


Jipe iia lee 


[a,b] 


Condición de integrabilidad de Riemann. f es integrable en [a, b] 
si y sólo si para cada e > 0 existe una partición P de ja,b] tal que 


A a T E 


Demostración. Supongamos que se cumple la condición. Es claro que el 
ínfimo de las sumas superiores y el supremo de las sumas inferiores coinciden. 
Por tanto si P € P, se tiene 
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f = sup {s(f, P): P € P} =f {SG P): PeP} = | f=|b—a] 


[a,b] [a,b] 


Recíprocamente. Sea e > 0 tan pequeño como queramos. Por las defini- 
ciones de ínfimo y supremo de un conjunto de números reales, existen respec- 
tivamente dos particiones P’ y P” tales que 


sP- 1<hy nen] 1< 
[a,b] 2 Z [a,b] 2 
Si P es la partición formada por la unión de P’ y P”, teniendo en cuenta que 
siempre se cumple 


SIAPISSAPS)] 1 y (AP) Ps k f 


[a,b] 2 [a,b] 


resulta que 


sP- f fsi y f| tp 


[a,b] [a,b] 


Como por hipótesis f es integrable y la integral superior e inferior son iguales, 
sumando las desigualdades se obtiene 
SU 2) TE) < 


+5=8€ 


E 
2 
Condición que queríamos demostrar. El 


El conjunto de funciones integrables es muy amplio. El siguiente teorema, 
cuya demostración el lector interesado puede ver en el libro indicado en la 
introducción, es otra caracterización de las funciones integrables. 


Recordemos que un conjunto A es numerable si existe una aplicación 
biyectiva entre A y el conjunto de N de los números naturales. Si A es un 
subconjunto de R, decimos que su medida es su longitud. Entonces A tiene 
medida nula si su longitud es cero, o lo que es equivalente si 

” fijado un número positivo arbitrariamente pequeño e > 0 existe una 
colección de intervalos que incluyen a todos los puntos de A tales que la 
suma de sus longitudes es menor que e”. 
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Es obvio que un número finito de puntos tiene medida cero y, como ve- 
remos en los ejemplos, también tiene medida cero un conjunto numerable de 
puntos. 


Caracterización de las funciones integrables (teorema de Lebesgue). 


Sea f : [a,b] —>R una función acotada. Una condición necesaria y suficiente 
para que exista Jia b] f es que el conjunto de puntos de [a,b] en los que f no 
es continua tenga medida nulo. 


Como consecuencia, toda función continua en [a,b] o bien discontinua en 
un número finito o numerable de puntos es integrable. 


7.2. Ejemplos. 


a) Sea A = (21,22, 23, ....., Tn, -.... | un subconjunto numerable de puntos 
de R y € > 0. Si consideramos los puntos de A pertenecientes respectivamente 
a intervalos de longitud e/2,£/4,€/8,....,e/2”,..., la suma de las longitudes es 
e ya que se tratan de los términos de una progresión geométrica cuyo primer 
término es e/2 y cuya razón es 1/2, esto es 


por lo tanto A tiene medida nula. 


b) La función f(x) =0 si z es racional y f(x) = 1 si z es irracional, en el 
ejemplo 7.1. b), vimos por la definición que no era integrable en el intervalo 
[a,b]. Aplicando el teorema de caracterización es obvio que no puede serlo 
porque es discontinua en todos los puntos de [a, b] y la longitud del intervalo 
es b— a. 


c) Las funciones polinómicas y las trigonómetricas seno y coseno son 
continuas en R y por tanto integrable en cualquier intervalo. 


Antes de establecer las propiedades de las funciones integrables y de la 
integral es necesario tener en cuenta las siguiente relaciones entre las parti- 
ciones. 


Dada una partición P = {a = to, ty, ..., ti, -tn = b} se llama norma de 
P y se denota por || P|| a la longitud del mayor subintervalo de P, esto es 


o e 
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IPI = máx (tt 1 :1<13<n) 


y dadas dos particiones P y Q de [a,b] , se dice que Q es más fina que P si 
P C Q, o en otras palabras todos los puntos de P pertenecen a Q. Es claro 
entonces que ||Q]| < ||PI]. 


Además, es muy sencillo demostrar por inducción que si Q consta de k 
puntos más que P, se cumple 


en donde M es el supremo de f en [a,b] y m su ínfimo. Compruébese que se 
cumple añadiendo a P un sólo punto. Supóngase cierto si se añaden k — 1 y 
pruébese que se cumple para k (se deja como ejercicio). También lo podemos 
razonar directamente ya que cada uno de los puntos añadidos a P contribuye 
a las sumas con (M — m) || P]] como máximo. 


Como consecuencia inmediata de la propiedad anterior, si Q es más fina 
que P, resulta 


s(f,P) E s(f,Q) € S($,Q) < S(f, P) 


y como consecuencia de esta propiedad, sean cuales sean las particiones P y 
P’ la suma inferior de una es menor o igual que la suma superior de la otra, 
es decir 


sf P)<S(f,P) 
ya que la partición Q = PU P’ es mas fina que P y P’. 


2.1. Propiedades de las funciones integrables. 


Estudiamos ahora las propiedades esenciales de las funciones integrables 
y con ellas las reglas de cálculo de la integral. Las demostraciones se basan 
en la condición de integrabilidad de Riemann. Supondremos que f y g son 
integrables en [a,b] y AER. 
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Propiedades de las funciones integrables. 


1. f +g es integrable en la, b] y se cumple 
b b b 
tara [tries | ola) 
2. Af es integrable en la, b] y se cumple 


Proa = af Hoas 


3. Sia < c < b, entonces f es integrable en la, c] y [c, b], y se cumple 


f toa = f toas -+ f tos 


4. Si f(x) > 0 para todo z € fa, b], entonces 


f toa >0 


5. Si f(x) > g(x) para todo z € [a,b], entonces 


J tos > f soa 


6. La función valor absoluto |f| es integrable en [a, b] y se cumple 
b 
| f Fod 
Demostración. 


1. Sea P una partición cualquiera de [a, b]. En cada subintervalo [t;_;, t:l 
de P, designemos por m; y M; el ínfimo y el supremo de f, por m; y Mí el 


< f told 
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ínfimo y el supremo de g y por m}? y M! el ínfimo y el supremo de f + g, 
como 


mam>+m y M? <M +M; 
se cumple 


A E A E TE G, FSP) 


Veamos que f + g cumple la condición de integrabilidad de Riemann y es 
integrable. Dado e > 0, existe una partición P tal que 


€ E 
SLP) (f, PS3 y Sl, P)=s(9,P)<> 
y por tanto 


S(f+9: P)-s(f+9, P) < S(S,P)+S(0, P)—Is(S, P) + s(g, P] < E+E =e 


3 
2 


Además, como 


s(f, P)+s(g, P) < s(f+9,P) < f E EU TAFE SPES.) 


a,b 


y por otro lado 


MPA) | f+ 9< SUP) +S, P) 


E (REJIO) <e 


lo cual es cierto para todo £ > 0 (ya que hemos fijado e arbitrariamente), y 
como consecuencia los números tienen que ser iguales, es decir 


ia) f f+ J g 
[a,b] [a,b] [a,b] 


Igualdad que queríamos demostrar. Œ 


resulta que 
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2. Sea P una partición cualquiera de [a,b]. En cada subintervalo [ti—1, t;] 
de P, designemos por m; y M; el ínfimo y el supremo de f, por m; y M; el 
ínfimo y el supremo de Af. 

Si A > 0, entonces m; = Am; y M; = AM;, con lo que 


S(Af,P)=AS(AR,P) y SOf,P)=AS(f,P) 


Como f es integrable 


af =p son E = f 
[a,5] PEP PEP PeP PeP 


£ 
[a,b] 
y resulta que 
sups(Af R) =n SA PSA T 
PEP PeP [a,b] 
en consecuencia Af es integrable y | 
Si À < 0, se razona de la misma manera que en el caso anterior teniendo 


No da 

[a,b] [a,b] 

en cuenta que m; = AM; y M; = Am; con lo que se cumple 
s(Af, P) =AS (Af, P) y Sf, P) = às(f, P) 


y se continúa todo el proceso. Ll 


3. Sea £ > 0. Como f es integrable en [a,b] existe una partición P 
tal que S(f, P) — s(f, P) < e. Consideramos c € P, en caso contrario 
se lo añadiríamos con lo cual obtendríamos una partición más fina que 
seguiría cumpliendo la desigualdad anterior. Tenemos así una partición P, = 
La,t1,....,t;-1,c) de [a,c] y una partición Pa = fe, ti+1, ...., tn-1, 0} de [e, b], 
cuya unión es la partición P, y se cumple 


s(f P)= AR POSSE PY y AAN AS E 
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por tanto 


SF, P) — s(£ PO] + [5(f, Pa) = ($, Pajl = SF, P)-s(f, P) < e 


y cada corchete es menor que € por lo que se cumple la condición de integra- 
bilidad de Riemann de f en [a,c] y [c, b]. Además, como 


AS os (Ba) 
PEP P ePi PEP2 


O 


o a r 


y queda demostrado. LJ] 


resulta que 


4. Si f > 0, para cualquier partición P la suma s(f, P) > 0. Entonces 
és E 


5. Si f > g, entonces f —g > 0 y teniendo en cuenta la propiedad anterior 
y la propiedad de la suma resulta, 


e t=a=/ t-f g20> pea g 
[a,b] [a,b] [a,b] [a,b] [a,b] 


6. La demostración de que |f| es integrable, se propone como ejercicio, 
para ello aplíquese la condición de integrabilidad de Riemann. De la desigual- 


dad — |f| < f < |f|, por la propiedad anterior 
a i 
[a,b] [a,b] 


-j i< f T f| = 
[a,b] [a,b] [a,b] 


con lo que si Si. FO 














EA 


y si fias f<0 
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id jr 


en cualquiera de los dos casos se cumple la propiedad. © 








Nota. La integrabilidad de las funciones f +g, Af y |f|, además de pro- 
barla mediante la condición de integrabilidad de Riemann, se puede razonar 
directamente aplicando el teorema de Lebesgue. Por hipótesis los conjuntos 
A y B en los que las funciones f y g son discontinuas tienen medida cero. 
Entonces, como máximo, el conjunto de los puntos en los que f +g, Af y |f] 
no son continuas es la unión de A y B, cuya medida indudablemente también 
es nula. 


En el apartado siguiente estudiaremos como la integral puede expresarse 
mediante el límite de una sucesión de sumas. Como consecuencia, la de- 
mostración de las reglas de cálculo anteriores son evidentes a partir de las 
propiedades de los límites de sucesiones. 


2.2 La integral como límite de sumas 


En el capítulo anterior afirmamos que la integral se podía expresar como 
un límite. Veamos que esto es así. Designemos por d(f, P) la suma 


o(f, P) = 24 (E) ¡AN 


en donde é; es un punto cualquiera del subintervalo [t;_,,t;]. Como m; < 
F(€¡) < M; es claro que 


s(f, P) So (f, P) € S(f, P) 


Si f es continua en [a,b] alcanza su máximo y su mínimo en cada uno de 
los subintervalos [t,_,,t;], entonces cualesquiera que sean los puntos €, € 
Her til, resulta 


s(f, P) = nf {o( f PY: é SMA y S P y 
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Consideremos de forma particular la partición P, definida para cada n € N 


por 








b— b— b— 
P, = faa 4 S EE „a +n tso} 
n n n 
que determina n subintervalos de igual longitud en fa, b]. 


La integral como límite de sucesiones de sumas. Sea f : [a,b] + R 
acotada. Si f es integrable en la, b], entonces existe lím o(f, Pa) y su valor 
n—>)00 
es la integral de f en [a,b]. 


Demostración. Si f es integrable en [a, b], por la condicion de integrabil- 
idad de Riemann dado € > 0 existe una partición P tal que 


s(.P)< | 


E 
f+5 
[a 2 


Como cualquiera que sea P, la partición PU P, es más fina que P,,, se cumple 


A Y AS 
[a,b] 2 


y si P tiene k puntos distintos de los de P,,, resulta 
SF, Pn) — AF PUP,) < k(M — m) E 
en donde M y m son el supremo y el ínfimo de f en [a, b]. Sumando las dos 


últimas desigualdades 


SE P)<] f +5 ERO — m) Pa 
[a,b] 
Ahora bien, como ||P, || = (b — a)/n, si no es un número natural tal que 
k(M — m)(b — a) 


> 
e E/2 


para cualquier n > ny se tiene 
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k(M — m)(b —a) T 


N 


y resulta 


+ 





=E 


0< SFP) | TAE T ER > 


pS E 
[a,b] 2 n 2 


es decir, para cada £ > 0 existe no € N tal que si n > no, entonces O < 
CA Jiasi f < £, luego 


lím S, P A f 
n-300 [a,b] 


Un razonamiento idéntico para las sumas inferiores s( f, P,) nos muestra 
que 


lms P)= f i 


[a,b] 


Finalmente como 
wa B o 
es obvio que lím ola Pa = Sia, El 


Una consecuencia inmediata del resultado anterior, es que el límite de 
una sucesión de la forma 








es E f(x)dx ya que an es una suma del tipo o(f, Pn). 
7.3. Ejemplos. 


a) El límite de 
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como 
IS nm IS 1 
n=) n 
Z (n +: ye fa De 
es una suma S(f, Pa) de la función f(x) =1/(1 + x)’, resulta 


lím an = — d 
noo har 


b) Sea la sucesión 


E e A A 
A AAA a a -5 
n n WAR n 


Como 177, = = S(f, Pa), en donde f(x) = x?, resulta que 


lím an = lím = D 5 z= f as 
n—>00 n> ooo n 


3. Los teoremas fundamentales del cálculo. 


El siguiente resultado constituye una herramienta muy útil para obtener 
cotas de integrales cuyo valor exacto no podemos conocer o bien de las que 
sólo necesitamos un valor aproximado. Supondremos, como de costumbre, 
que f : [a,b] > R es acotada y que M y m son el supremo y el ínfimo de f. 


Teorema del valor medio del cálculo integral. Si f es continua en 
la, b], entonces existe un punto c € [a,b] tal que 


| Fed = 100) 


Demostración. Como m < f(x) < M para todo z € [a,b], se tiene 
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mo-a)= [maes | fojas f mes <Mb-0) 


a 


y como f es continua toma todos los valores comprendidos entre m y M, con 
lo cual existe c € [a,b] tal que 





1 b 
f= zig fo 
Por lo tanto se cumple el enunciado. Él 


A partir de una función f integrable en el intervalo [a,b] podemos definir 
una nueva función F en fa, b] haciendo corresponder a cada uno de sus puntos 
zx la integral de f en el intervalo [a, x] , es decir 


FEO i O 


Probemos que la función F' es continua en [a, b], que es derivable en todos 
los puntos en que f sea continua y además que su derivada F” coincide con 
el valor de f en el punto. 


Propiedad de continuidad. Si f es integrable en [a,b], entonces la 
función F es continua en [a,b]. 


Demostración. Sea x € [a,b] y h € R tal que z + h € [a,b]. Como 


J ATT f y foai e 


0 < líim|F(x+h)-—F(2)] < lím |h| M =0 
h=>0 h=>0 


z+h 
Beray Flo) = j oat < |a| M 








resulta que 


con lo cual lím F(x+ h)— F(x) =0 y f es continua en z. O 
— 


Primer teorema fundamental del cálculo. Si f es continua en x € 
[a,b], entonces F es derivable en x y F"(x)= f(x). 


Demostración. Fijemos un punto x € [a,b] y sea h € R tal que z +h € 
[a,b]. Como 
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x+h z+h 
Pla +h) =F(a)= de 1a=/" FO- fod- 
= [T YO- foda) 
dividiendo la igualdad por h, resulta 


A = f(2) = [F(£) — £(2)] dt 


Ahora bien, por ser f continua en z, dado e > 0, existe ô > 0 tal que si 
lt—x| < ô se tiene |f(t) — f(x)] < e, desigualdad que también se verifica 
para |A| < ô, tanto en el caso de ser h > 0 y t € [z,1 + hk] como en el caso 
de ser h<0yte€ [z + h, z] . Entonces 





Š Pu — f(x) dt] < < 17] EN O- fæla < r le=> 
con lo que 
, 1 z+h 
lím 7 1 [F(t) — F(x)] dt =0 


Como consecuencia 


F (x) = lím F(z +h) - F(z) = f(x) 


h>0 h 


es decir, F es derivable en x y su derivada es f(x). O 


Recordemos que una función F tal que su derivada es f, esto es F"(x) = 
f(x), se dice que es una primitiva de f y al conjunto de todas las primitivas 
de f se le llama integral indefinida de f. El segundo teorema fundamental 
nos permite calcular de manera muy sencilla la integral de f si conocemos 
una primitiva. 


Segundo teorema fundamental del cálculo. Sea f una función in- 
tegrable en [a,b]. Si existe F tal que F'(x) = f(x) para todo z € [a,b] . 


entonces Pro A ISA 
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A esta igualdad se la conoce con el nombre de regla de Barrow. 


Demostración. Consideremos una partición cualquiera P de [a,b]. Apli- 
cando el teorema del valor medio del cálculo diferencial a la función F en 
cada subintervalo [x;, 1;,1] determinado por la partición P se tiene 


Pri) — Flzi) = ME) (tig — 24) 


en donde É; € (zi, Ti41). Si M; y m; son el supremo y el ínfimo de f en 
[2;, Zi+1] , resulta 


milLig1 = Tal E LES) (Li J 2 < Milsi+1-z:) 
con lo que 
malti — 24) € n E Mi(Li41 — 25) 
Sumando las desigualdades desde ¿ = 1 hasta i = n, se obtiene 
O O s 


Como la partición P es arbitraria, la desigualdad anterior se cumple para 
cualquier partición. Entonces por ser f integrable 


; ! 
[rtve = sups(f, P) < PO) — F(a) < fpf S(S, P) = | toa 
luego 
/ “Hajdz=F(0) —F(a) 
y queda demostrado. C Í 
7.4. Ejemplo. 


La función F(x) = ar es una primitiva de f(x) = T en [0,1] ya 
que F”(x) = f(x), por tanto el valor del límite de la sucesión (an) del ejemplo 
7.3. a) es 


Laia romo +-(5)-: 
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De forma análoga el valor del límite de la sucesión (an) del ejemplo 7.3. 


b) es 
1 371 
1 


En numerosas ocasiones la complejidad de la función integrando induce 
a buscar una nueva función cuya integral en otro intervalo sea más sencilla. 
y cuyo resultado sea el mismo que el de la integral original. Este proceso 
se denomina cambio de variable. El siguiente teorema nos proporciona las 
condiciones en las que se puede Ilevar a cabo. 


Teorema del cambio de variable. Sea g : |c, d] > R una función con 
derivada continua en |c, d] y f una función continua en g([c, d)). Si a = g(c 
y b = g(d), entonces 


d b 
ranas = f Hoas 


Demostración. Por ser g continua en [e, d] y f continua en [a, b] = g([c. d). 
la función compuesta f o g es continua en [c,d]. Además, por hipótesis. la 
función g’ es continua, con lo cual la función producto (f o g)g’ también es 
continua y como consecuencia integrable en el intervalo [c, d]. 

Sea F : [a,b] — R la función definida por 


F)= | Fods 


y sean G y H las funciones de [c, d] en R definidas por 


Gla) = f FDO y HE) = FUE) 


Por el primer teorema fundamental G es derivable, y teniendo en cuenta 
la regla de la cadena, su derivada es 


Gu) = f (g(2))g (2) 


A su vez, por la regla de la cadena la derivada H'(x) es 
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H'(x) = F"(g(x))g' (2) 


y por tanto G'(x) = H'(x) 
Además, por el primer teorema fundamental F'(y) = f(y) para todo 
y = g(x) € [a,b] = g(le, di), con lo cual (eu) = H (z) y 


H'(x) = f(g(x))g' (x) 


Como consecuencia las funciones G y H tienen la misma derivada y ne- 
cesariamente se diferencian en una constante k, es decir, G(x) — H(x) = k 
para todo z € [c,d]. 

En el caso particular de que sea x = c, se tiene 


k =G(c) = H[c) =0-— F(g(c)) =—F(a) =0 


luego la constante k es cero y por consiguiente G(x) = H(x) para todo 
x € fc, d], esto es 


f sata = Fiola) 


para todo z € [c,d]. 
Si se considera x = d en la expresión de arriba, se obtiene 


d b 
f EOOD = Fo) ="0= | Fods 


y el teorema queda probado. Ll] 


4. Métodos de integración. 


Si las funciones integrando son continuas, la regla de Barrow proporciona 
el valor de la integral como diferencia de los valores que toma una primitiva 
en los extremos del intervalo de integración, de aquí la importancia que tienen 
los métodos para determinar primitivas. De forma sucinta, revisamos algunos 
de ellos. 
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Integrales inmediatas. 


A continuación, y a modo de ejemplo, se da una breve tabla de integrales 
inmediatas, que el lector puede completar con otras funciones de derivadas 
conocidas con las que ya está familiarizado. 





O Tr Oa fe no +C tipo potencial 
IA) — at) + O tipo exponencial 
aeh e de =1n f(12)+C tipo logarítmico 
4. f cos f(x) f'(1)dx = sen f(x) + C tipo coseno 

5a gt = tag f(1)+C tipo tangente 


dx = arcsen f(1) + C tipo arco seno 


E 
TO 


dx = arctag f(x) + C tipo arco tangente 


1+ f(x)? 


Integración por cambio de variable. 


Esta técnica se basa en el teorema de cambio de variable que hemos visto 
antes. Si f f(x)dx es complicada, buscamos una función derivable z = z(u), 
con lo que dz = 2'(u)du y la integral f f(x(ujz'(u)du sea mas sencilla. Si 
F(u) es una primitiva de la nueva función integrando, entonces F(u(x)), en 
donde u = u(x) es la función inversa de z = z(u), es una primitiva de f(x), 
como fácilmente se comprueba mediante la regla de la cadena. 

No existe ningún método general para resolver una integral mediante un 
cambio de variable. Hay que estudiar cada caso para tratar de encontrar el 
cambio, aunque algunas clases de funciones particulares si tienen cambios 
conocidos.. 


7.5. Ejemplo. 
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1 2 1 d 
T= i — | 1 + — |] dz sugiere el cambio u = — ya du = — Los límites 
Te dE Eo TA 
de integración son para z = 1, u = 1 y para z = 4, u = 1/4. Por tanto existe 
1/4 1 
r=- (+ 2u)du= | (1 + 2u)du 
1 1/4 
Efectuando un nuevo cambio t = 1 + 2u, dt = 2du, cuyos límites son 3/2 


y 3, resulta 
i ma O 
I=3/ i= Plg 


Integración por partes. 


La expresión de la integral por partes se deduce a partir de la derivada 
de un producto de funciones. Sea u = u(x) y v = v(x) 


(u(z)v(z)Y = u(z)o(z) + u'(z)v(z) 





integrando 
ulco) = Jutontayas+ futuro 
con lo cual 
f vewa) =u(s)vlz)]- Jutoutaydo 
7.5. Ejemplo. 
dx 
I = farctag zdz, se hace u = arctag x y du = dx con lo que du = EX 
T 


y U= 1. 
d 1 
I=wartago— [17 = zarctagr — z In(14 2%) +C 


Obsérvese que la última integral es inmediata. 
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Integración de algunas clases de funciones. 


Funciones racionales. 


IP 
Sean P(x) y Q(x) dos polinomios. Para resolver J gd, en primer 
T 


lugar si el grado de P(x) es mayor que el de Q(x) se efectua la división. Su- 
pongamos que el grado es menor, entonces se determinan las soluciones de la 
ecuación Q(x) = 0 y se factoriza el polinomio Q(x) para poder descomponer 
Plz) 
Q(z) 


como suma de fracciones de la forma 








si a es una raíz simple 


Aj Az Am 


TE Gay +... E = gy" si a es una raíz de orden m 


si a + bi son raíces complejas. 


cuyas integrales son inmediatas. Para determinar los coeficientes de los nu- 


P(x) 
Q(z) 


los términos de su descomposición después de reducirlos al común denomi- 


nador Q(x). 


meradores se identifica y la fracción resultante de efectuar la suma de 





7.6. Ejemplo. 


IN A Las raíces del denominador son x = 0 doble y z = 01. 
Entonces 


A ME A 
L(x? +1) 2-22 241 
_ Azr(z? +1) + B(1* +1) + Ca? + Dr? 
5 x?(x? + 1) 


Identificando los coeficientes de los polinomios de los numeradores, resulta 


ARO A BE DIENOA=0, B=1 
con lo cual A = 0, B= 1, C = 1 y D = —1, y se tiene 
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1 gl LA 
r= | das | Gto +3I0(0+1) —arotaga+C 


Funciones racionales de senz y cos 2. 


La integral f R(senx,cos x) siempre se puede transformar en integrales 
racionales mediante el cambio. 


A 


cos r = =—— 
1 +u? 


£ 2du 
uE, EE a 


Sin embargo, si la función R cumple alguna propiedad, puede utilizarse un 
cambio más sencillo. Por ejemplo: 


R(=senzx,cos x) = —R(senzr,cos x) función impar en senz, el cambio es 
—du Z 
cosg = u, dí = ==, sent = yl — u 
VO =u2 
R(senzg,— cos x) = —R(senz,cos x) función impar en cos x, el cambio es 


du 
senz =u dr = —=—, cost = V1 — u? 
yl — u? 


R(-senz,—cos x) = R(senzx,cos 1) función par en tagz, el cambio es 





tagr = u dz = w senz = £ CoS T = L 
á E 1 + u? V1 + 2 


En los ejercicios se propodrán funciones racionales dependientes de fun- 
ciones de diferentes tipos, indicando el cambio que se debe efectuar. 


7.7. Ejemplo 
7 d l 
n= Jo /2 4% Se hace el cambio general u = tag a de donde 
2 — COST 2 
T u T 1 2du 
sen — = ————, COS = = 


; AA U 
2 yi+u? 2 yl+u2 1 +u? 


2 2 e El 
; sen“ z + cosóx = 1; senz = 2sen= cos = y 
2 2 





sen z 
(Recuérdese que tag zx = 


27 27 
cos z = cos? — — sen? —). 
2 2 
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2 


u e ; ” 
e los nuevos límites de integración son 0 y 
u 


Entonces, como cos z = 


1 y resulta 


=f 1 2du -f A 
=, ME ER i; 


1 +u? 


2 AB 2 A 2717 
ala G-9- 5 








Finalmente recordemos que la interpretación geométrica de la integral era 
el área de un recinto. Si suponemos que f está definida en [a,b] y f(x) > 0, 
la integral es el área del recinto limitado por la curva y = f(x), las rectas 
y =0,x =a y x = b. Esto nos permite abordar el cálculo del área de recintos 
planos limitados por dos o más curvas, dividiéndolo si fuese necesario en 
subrecintos y utilizando las propiedades de la integral. 


Por otra parte, el que la integral se pueda calcular como una suma nos 
permite también calcular volúmenes de cuerpos engendrados al girar un arco 
de curva alrededor de un eje. Por ejemplo, si la curva anterior y = f(x) gira 
alrededor del eje Ox, el volumen del cuerpo generado es 


"= f raya 


También se aplica a numerosos problemas físicos tales como, masas, mo- 
mentos de inercia, centros de gravedad, ect., cuyas definiciones conducen a 
integrales. En los ejercicios siguientes proponemos algunos de estos proble- 
mas. 


7.8. Ejemplos. 


a) Determinemos el área del recinto limitado por las rectas y = x, y = 2x 
y la parábola y = z?. 

Los puntos de corte de las rectas con la parábola son (0, 0), (1,1) y (2, 4). 
Por lo tanto el recinto M es la unión de dos subrecintos M, y Mz, en donde 


M9): 07 <p < y < 2x) 
MAS O IA a 2) 
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(Represéntese M). Entonces el área S de M es la suma de las áreas Si de 


Mi y S2 de Mo. 
1 1 1 
s,=/ 2ada— | ada S= S 
0 0 2 


2 2 9 
s=] 2zdz — | rdr = -= 
1 1 3 
y 5="7/6. 


b) Determinemos el volumen del cuerpo M de revolución engendrado por 
el arco de la cúbica y = x? entre x = 1 y x = 3 al girar alrededor del eje Oz. 
(Represéntese M). 

El radio de giro es f(x), por tanto 


3 3 
ve " Tf (a) dx = rf T z8 — 1)r 
1 1 


El cuerpo M” obtenido al girar el arco anterior alrededor del eje Oy, como 
el radio de giro es z = yY/y, resulta 


27 


V=] yydy=60 
1 
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Ejercicios y cuestiones propuestos 


1. Demostrar por la definición que la función f(x) = x? es integrable en 
el intervalo [0, 1] y calcular el valor de la integral. 


2. Demostrar, aplicando la condición de integrabilidad de Riemann que 
toda función monótona creciente o decreciente en un intervalo [a, b] es inte- 
grable en él. 

Indicación. Fijado € > 0, considérese una partición P, tal que n cumpla 
que (b— a) [f (b) — f (a)] /n sea menor que e. 


3. Demostrar, aplicando la condición de integrabilidad de Riemann, que 
si f es integrable en [a,b], la función |f| valor absoluto de f es integrable en 
él. 

Indicación. |f| = ft + f7, en donde 


O A o a do 


entonces basta probar que f* es integrable. 


27 COS? NT 
a eo a esto, 
LATE 
Indicación. Acótese el valor absoluto de la integral por la integral del valor 
absoluto y esta integral por el término de una sucesión que converge a cero. 


4. Pruébese que lím f 
n—>00 


5. Razónese mediante el teorema de Lebesgue si son integrables o no las 
siguientes funciones. 


a) El producto de dos funciones integrables. 


OE po O Sy < La), = e? si 
Ma a ep 1<om 


c) f : [-1,1] + R definida por f(x) = w +1 si x es racional y f(x) = 2? 
si x es irracional. 


e 1 vd . . 7 
6. Determínese f x22dx como límite de una sucesión de sumas. 


7. Determínese mediante una integral el valor del límite de la sucesión. 


220 Capítulo 7 


a) n = Al b) Un = — EE A 52422 id Pr 0 FE] 
8. Encontrar una sucesión de sumas S(f, Pa), en donde f(x) = e y Pn 
es una partición de [0, 1] , que converja a il erdz. 


1 21 sen nz 


9. Probar que para cualquier n se cumple de =r z Ene DA 
T 





10. e los límites. 


TT 
) ím f —— dr b) lím f, T 


n— oo r +T 


11. Calcular las siguientes integrales. 


1 T 1 
a) E b) Qe c) 3% 
3r +5 


E PE AE 
12. Integrar por partes. 
a) flnzdx b) farcsenzdr c) fe” sen3xdx 
d) fzx"lnzdx e) fx*sen(z +2)dz 
13. Integración de funciones racionales en x°, qx*/d, ... . Se hace el cambio 
x = tò, en donde A es el mínimo común múltiplo de los denominadores b, d, .... 
Resolver las siguientes integrales 


y AE b) f o 


14. Calcular las siguientes integrales de funciones trigonométricas. 


a) ftagtzdx b)f 


d) f sen 3x cos 5xdzx 


COS T 1 
dx c) f — dr 
COS T + sen x 





15. Integración de funciones racionales en a”, a > 0. Se hace el cambio 
x = log, t. Integrar 

afede 
4741 5er + 1 e2r — 2er +1 
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b p/n b q/m 
16. Integración de funciones racionales en ot , it R.. 
cx +d cr +d 
O 


sn = {ò en donde A es el mínimo común múltiplo de 
n,m,... etc. Integrar: 
AAA py cos 1 +37 2 
YO—=I+yY5d—z (a — 2)? => 


17. Resolver las integrales mediante los cambios indicados. 


r=? 1 
a) PEA doy cambio zx — 1 = ! 
=i cos u 





Se hace el ca E 





2 
T 
b) | —==dz, cambio x = tagu. 
e gu 
c) f(x + 2)sen(z? + 4r — 6)dx, cambio 2? + 4z — 6 = u. 


tag(l 
d) f E cambio ln z = u. 
e) fo ===" cabo m u 


18. Determínese mediante integrales el área del círculo limitado por la 
circunferencia de ecuación 2? + y? = 9. 


19. Determínese el área del recinto limitado por la curva y = (x — 1)? y 
la recta y = +1. 


20. Determinar el volumen del cuerpo engendrado por y = 2y/sen 1 cos z, 
0<x<r/72 al girar alrededor del eje Oz. 





Capítulo 8 
Funciones de varias variables 


1. Introducción y objetivos. 


Sabemos que el conjunto R” de las n-uplas ordenadas (u1, uz, ..., Un) de 
números reales con las operaciones suma y producto por un escalar A € R 


(uy, uz, a) + (v1, va, woa = (u + V1, U2 + V2, -.., Un + Un) 
Alas u)e= (A, Alto, ...; Alta) 


constituyen un espacio vectorial. Consideremos la base canónica {e;} = 
£(0,0,...,1,...,0)),2 = 1,2,...,n y fijemos un punto O del espacio, al que 
llamamos origen, a cada vector u = OP le hacemos corresponder el punto P 
e identificamos las coordenadas del vector u con las coordenadas del punto P. 
Tenemos así definido el espacio de puntos o espacio afín asociado al espacio 
vectorial R” en el que se definen las funciones que vamos a estudiar. 


Denominamos funciones de varias variables a las definidas en un sub- 
conjunto A de R”,n > 1. Una función f de A en R” se llama función o 
campo vectorial si m > 1 y función o campo escalar si m = 1. Ca- 
da función f con valores R™ viene determinada por m funciones escalares 
(fis J2, ..., fm) que reciben el nombre de componentes de f. 


8.1. Ejemplo. 


La función de f : R? > R definida por f(x,y,z) = 122 + sen zy es 
una función escalar, y la función f : R? —> R? definida por f(x,y) = 


223 
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(a%y?, £ cos y’, 1?—y?) es vectorial y sus tres componentes son f,(x, y) = x*y?, 
fala, y) =r y y Fale, y) =1 =y*. 


Para estudiar el límite, la continuidad y la derivabilidad de esta clase 
de funciones, de forma análoga a lo que sucedía con las funciones de una 
variable, necesitamos definir en R” la distancia entre sus puntos y medir 
así la proximidad. La distancia que consideraremos (se pueden definir otras 
muchas), llamada distancia euclídea, se establecerá a partir de la norma 
||-|| procedente del producto escalar, que desempeña un papel idéntico 
al del valor absoluto |:| en R. Recordemos que el producto escalar es una 
aplicación bilineal, Ejemplo 5.1 a) del Capítulo 5, y por tanto satisface las 
propiedades de estas aplicaciones. 


En general, una función vectorial cumple una propiedad P si cada una de 
sus componentes cumple P, por ello la mayor parte del estudio se realiza para 
funciones escalares. Además el razonamiento necesario para n variables es el 
mismo que se hace para dos, con lo cual consideraremos funciones f : R? —> R. 
Otra cuestión a tener en cuenta es que la demostración de una gran parte 
de las propiedades se basa en el resultado obtenido para funciones de una 
variable, lo que simplifica notablemente la exposición. 


El esquema del capítulo es el siguiente: después de estudiar la topología 
de R”, analizaremos los conceptos de límite y continuidad de una función, 
para centrarnos a continuación en el cálculo diferencial y definir las derivadas 
parciales, la diferencial, establecer las reglas de cálculo y el teorema de Taylor. 
Igual que en una variable el teorema permite aproximar a la función en el 
entorno de un punto mediante un polinomio de varias variables. Finalizamos 
con el estudio de las condiciones necesaria y suficiente para la existencia de 
extremos relativos. 


1.1 Objetivos. 


1. Calcular productos escalares, normas, distancias y el ángulo que forman 
dos vectores. 


2. Estudiar si un conjunto es abierto o cerrado y determinar su interior, 
exterior y frontera. 
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. Calcular la adherencia y acumulación de un conjunto. 
. Calcular límites de sucesiones. 
. Calcular límites de funciones y estudiar la continuidad. 


3 
4 
5 
6. 
y 
8 
9 


Determinar las derivadas parciales y la diferencial de una función. 


. Aplicar la regla de la cadena. 
. Calcular las derivadas sucesivas. 


. Determinar el desarrollo de Taylor. Polinomio, resto y cota de error. 


10. Determinar los extremos relativos de una función. 


2. El espacio euclídeo R”. 


Comenzamos recordando el producto escalar de dos vectores a partir del 
cual definimos la norma y la distancia euclídea. 


En R” definimos el producto escalar o producto interior de los vec- 
tores u y v como sigue: 


n 
U: V = UV + UW + .... H UnUn = ) UU; 


¿=1 


Sean u, v, w elementos de R” y A un número real, se cumplen las siguientes 
propiedades: 


IR 
27 
3. 
4. 


u: u= 0 si y sólo si u = 0. 

u:-v=v-u (propiedad conmutativa). 
u-(v+w)=u:v+u:w (propiedad distributiva). 
(Au) -v=A(u- v) =u- (Av) (propiedad homogénea). 


Al espacio afín asociado a R” dotado de su producto interior le llamamos 
espacio euclídeo de dimensión n. Si n = 2 tenemos el plano euclideo y si 
n = 3 el espacio euclídeo tridimensional. 
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2.1. Norma de un vector. 


A cada vector x = (z1, ..., £n) de R?” le asignamos un número real ||x]|, 
llamado longitud, módulo o norma euclídea de x definido por 


lx] = (x x}? = 4/22 + r2 +... + z2 


Observemos que ||x|| es siempre mayor o igual que cero y por tanto || . || 
es una aplicación de R” en los números reales no negativos R*. Si n = 1, 
la norma coincide con el valor absoluto del número real x. Para probar las 
propiedades de la norma, que son las mismas que las del valor absoluto, 
necesitamos establecer previamente la desigualdad siguiente. 


Desigualdad de Cauchy-Schwarz. Para todo par de vectores x e y de 
R” se cumple: 


< lx! iyl 





n 
> Ziyi 
¿=1 


Demostración. En efecto, si x e y son linealmente dependientes, existe un 
número real A tal que y = Ax; por tanto 


n n 
> Tiyi > TADA 


Si x e y son linealmente dependientes, para cualquier A € R, se tiene 
y — Ax % 0; por consiguiente ||y — Axl] > 0 y el trinomio de segundo grado 
en A 





= JA xI? = Ixl Axli = Ixl y 














n 


ly -Axl = $ (y — 2)? =Y y? 21) mt A 
p= i=] (=l 


all 


no tiene raíces reales. Como consecuencia su discriminante es negativo, es 


(En) (2) (20) 


decir 


con lo cual 
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n 
X Tiyi 
i=1 


en donde hemos simplificado y escrito la expresión en función de las normas. 
C] 


< ixl liy 








Propiedades de la norma. Sean x e y dos vectores de R” y A un número 
real, se cumple: 

a). |x|] = 0 si y sólo si x = 0. 

b). [|Ax]] = [Al [xl]. 

c). x+ yl] < lxil + ly- 


Las demostraciones de a) y b) son inmediatas. Probemos c). Como 


n 


n n 
[lx + y]? = Da +y) = We + 229 + y?) = |x]? +2 N tiy + liyi? 


i=1 i=l i=1 


por la desigualdad de Cauchy- Schwarz 


2 2 2 
[lx + y] < ixl + 2x yll + iyl = (lll + lyi’ 
extrayendo la raíz cuadrada resulta la propiedad. 


Ángulo que forman dos vectores. El coseno del ángulo aœ que forman 
dos vectores x e y viene dado por 


X:y 


cosa = — r 
ISA] 


Como consecuencia, dos vectores no nulos x e y son ortogonales si y sólo 
six + y = 0. Un vector es ortogonal a un subconjunto no vacio M si lo es a 
cada uno de sus elementos. Si M es un subespacio de R”, es evidente que un 
vector es ortogonal a M si lo es a una de sus bases. 
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2.2. Distancia entre dos puntos. Conjuntos acotados. 


A partir de la norma euclídea y sus propiedades definimos en el espacio 
afín la distancia euclídea entre dos puntos. Sus propiedades son una conse- 
cuencia inmediata de las tres propiedades de la norma. 


Definición de distancia. Se llama distancia entre dos puntos x e y de 
R” al número 


dx, y) = lx — yl = Y (1 — ya)? + (22 — ya)? +... + (En — Yn)? 


Propiedades de la distancia. Sean x,y,z tres puntos, se tiene: 
a) d(x,y) =0 si sólo si x= y. 

b) d(z, y) = d(y,x). 

c) dz, 2) < d(x, y) + d(y, 2) 


Si a es un punto de R” y r un número real positivo, r > 0, a los conjuntos 
B(a,r) =[ ER”: dame yB (ar == (PER dla er) 


les denominamos respectivamente bola abierta y bola cerrada de centro 
a y radio r. Cualquier subconjunto V que contenga a una bola de centro a 
decimos que es un entorno de a. En particular cualquier bola de centro a es 
un entorno de a. 


Definición de conjunto acotado. Un subconjunto M de R” decimos 
que es acotado si está contenido en una bola cualquiera del espacio. 


Como consecuencia de la definición, las distancias entre dos puntos cua- 
lesquiera de un conjunto acotado están acotadas y por tanto su supremo es 
una cantidad finita. A este número le llamamos diámetro de M. Los con- 
juntos acotados cumplen propiedades muy sencillas y sus demostraciones son 
obvias. 


Propiedades de los conjuntos acotados. 


1. Todo subconjunto de un conjunto acotado es acotado. 
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2. La unión de dos subconjuntos acotados, y por tanto de un número finito 
de ellos, es un subconjunto acotado. 


3. La interesección de un número cualquiera de subconjuntos acotados es 
un subconjunto acotado. 


8.2. Ejemplos. 


a) Sean u = (1, —2, -3) y v = (4,2, —1), entonces: 


= El producto escalaru - v = 1 x 4+ (-2) x 2 + (-3) x (-1) = 3. 


= Las normas ||u]| = 4/12 + B = y14 y ||vll = 21. 


= La distancia entre los puntos es 


d(u, v) = y (1-4) 2 — 22 + (-3+ 1)? = v29. 


= El coseno del ángulo a: que forman u y v es cos a = TEJA 


= La ecuación del subespacio ortogonal a u es (1,—2,-—3) - (x,y,z) = 0, 
es decir, x — 2y — 3z = 0. 


b) En R? un cuadrilátero, un círculo, un segmento son conjuntos acotados. 
Una recta, una parábola, un semiplano son conjuntos no acotados. 


c) El diámetro del conjunto 


M = fize R: a +E<i) 


es 6, ya que se trata de la porción de plano limitada por una elipse cuyo eje 
mayor tiene longitud 6. 


d) El conjunto M = {(x, y, z) € RÌ : z = £? + y”) no es acotado ya que la 
norma de un elemento de M puede ser tan grande como se quiera, ||(x, y, z)|| = 
o a Ann 
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2.3. Conjuntos abiertos y conjuntos cerrados. 


Un subconjunto A de R” decimos que es abierto si para cada punto x de 
A existe una bola B(x,r) contenida en A. La familia de conjuntos abiertos 
cumplen las siguientes propiedades: 


a). Los conjuntos vacío Ý y el espacio R” son abiertos. 


b). La unión de una colección cualquiera de conjuntos abiertos es un 
conjunto abierto. 


c). La intersección de una colección finita de conjuntos abiertos es un 
conjunto abierto. 


Demostración. Las propiedades a) y b) son evidentes. Probemos c). Si z 
es un punto perteneciente a la intersección de un número finito de conjuntos 
abiertos, entonces pertenece a cada uno de ellos y para cada conjunto existe 
una bola de centro z contenida en él. La bola de menor radio está contenida 
en todos ellos y por tanto en su intersección. O 


Observemos que si el número de conjuntos abiertos no es finito, el ra- 
zonamiento anterior es falso ya que puede no existir una bola de menor 
radio. Por ejemplo la intersección de todos los intervalos abiertos de la forma 
(1/n, —1/n) de R es el punto 0 que evidentemente no es un conjunto abierto. 


Nota. En general dado un conjunto X, una familia de subconjuntos 
que cumplan las tres propiedades anteriores decimos que define en X una 
topología y sus elementos se llaman abiertos. 


Un subconjunto C de R” es cerrado si su complementario es abierto. A 
partir de las propiedades de los conjuntos abiertos, utilizando las leyes de De 
Morgan sobre los complementarios de la unión e intersección de conjuntos, 
se deducen las siguientes propiedades de los conjuntos cerrados: 


a) Los conjuntos vacío Ú y el espacio R” son cerrados. 


b) La intersección de una colección cualquiera de conjuntos cerrados es 
un conjunto cerrado. 


c) La unión de una colección finita de conjuntos cerrados es un conjunto 
cerrado. 
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Cada subconjunto M de R” determina en el espacio tres clases de puntos: 
interiores, exteriores y frontera de M, de tal manera que un punto cualquiera 
de R” pertenece únicamente a una de esas clases. 


Sea x € R”, decimos que z es un punto interior de M si existe una bola 
de centro z totalmente contenida en M. El punto z es un punto exterior 
si existe una bola de centro z totalmente contenida en el complementario de 
M. Finalmente, xz es un punto frontera si cualquier bola de centro x tiene 
puntos de M y puntos del complementario de M. 


Al conjunto de los puntos interiores de M se le llama interior de M, 
se representa por IntM y es obvio que se trata de un conjunto abierto. 
Al conjunto de los puntos exteriores de M se le llama exterior de M, se 
representa por Ext M y también es un conjunto abierto. Al conjunto de los 
puntos frontera de M se le llama frontera de M, se representa por Fr M y 
es un conjunto cerrado ya que su complementario Int MU Ext M es abierto. 
De acuerdo con estas definiciones, cada punto de R” pertenece a uno y sólo 
a uno de estos tres conjuntos, es decir, se cumple: 


R” = Int MU Ext MU Fr M 
Int M N Ext M = Int M N FrM = Ex4MNFrM=0 


Obsérvese que los conceptos anteriores proceden de la idea que poseemos 
de ellos en la vida ordinaria, así los aplicamos al interior, frontera y exterior 
de un país o de una finca vallada. 


Asociamos a M dos nuevos conjuntos su adherencia, que se representa 
por Adh M o bien por M, y su acumulación, que se representa por AcM 
o bien por M’. Un punto pertenece a Adh M o es un punto adherente 
de M si cualquier bola de centro x posee puntos de M. Es claro que todos 
los puntos de M pertenecen a Adh M. Un punto pertenece a Ac M o es un 
punto de acumulación de M si cualquier bola de centro z posee puntos de 
M distintos del propio x. Como consecuencia AcM C Adh M y los únicos 
puntos que pertenecen a Adh M y no pertenecen a Ac M son aquellos que 
poseen una bola cuyo único punto de M es el propio z. A estos puntos se les 
llama puntos aislados. 


Como ya comentamos en el caso de R, la expresión x — a sólo tiene 
sentido si a es un punto de acumulación de M, ya que x € M únicamente se 
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puede ir aproximando a a si (B(a,r) — {a}) N M # Ú para cualquier radio r 
tan pequeño como queramos. 


8.3. Ejemplos. 


a) El conjunto M = ([(2,y) €R?*:2<x<3,1<y<4) es la porción 
de plano limitada por un rectángulo excluidos sus lados. La bola de centro 
un punto cualquiera de M y radio menor que sus distancias a los lados del 
rectángulo está contenida en M, por tanto M es abierto y M = Int M. 
La frontera Fr M son los lados del rectángulo y Ext M es todo R? menos el 
rectángulo y sus lados. Es claro que Adh M = Ac M ya que no existen puntos 
aislados y ambos conjuntos son iguales a MU Fr M. Obsérvese también que se 
trata de un conjunto acotado cuyo diámetro es v10, longitud de la diagonal 
del rectángulo. 


b) El conjunto M = {(x,y,z) € R3 : x + 2y — 4 = 1) es un plano y por 
tanto es un conjunto cerrado ya que su complementario es abierto. En efecto, 
cualquier bola de centro un punto de R$ — M y radio menor que su distancia 
al plano está contenida en R3 — M. El interior de M es el conjunto vacío ya 
que cualquiera que sea el punto x del plano M que consideremos ninguna 
bola de centro x esta contenida en M pues tiene puntos de R? — M. Es 
claro entonces que Fr M = M y Ext M = R? — M y también es obvio que 
Adh M = Ac M = M. Obsérvese que se trata de un conjunto no acotado. 


c) El conjunto M = {(x,y) € R? : x =2, 0 < y < 1} es un segmento de 
R? que no contiene a su extremo (2, 0). Es obvio que el conjunto no es abierto 
y que IntM = Ø. Tampoco es cerrado porque su complementario no es 
abierto ya que (2, 0) es un punto de su complementario y no existe una bola de 
centro (2, 0) contenida en R*— M. Por otro lado Ext M = R? — [MU {(2,0)} 
y Fr M = M U {(2,0)}. Además Adh M = Ac M = Fr M. 


2.4. Sucesiones en R”. 


Recordemos que una sucesión en un conjunto X es una aplicación s : 
N > X. La imagen s(n) = £n se llama término n-ésimo o general de la 
sucesión, que suele representarse por (£n). Por tanto una sucesión en R” hace 
corresponder a cada n una m—upla (£n) = (17, 13,..., 27,) y cada sucesión 
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consta de m sucesiones de números reales a las que llamamos sucesiones 
componentes. El concepto de convergencia es análogo al establecido para 
sucesiones de números reales.. 


Definición de límite de una sucesión. Una sucesión (1, ) de R” se 
dice que es convergente al punto b de R”” si para todo e > O existe un número 
natural no tal que para todo n > Ny se verifica ||£n — b|| < e. En este caso lo 
denotamos por lím £n = b o bien (£n) > b. 

N—00 


La siguiente propiedad reduce el estudio del límite de las sucesiones de 
IR” al estudio de las sucesiones en R, es decir, al estudio de las sucesiones 
componentes. 


Caracterización del límite. La condición necesaria y suficiente para 
que el límite de la sucesión (£n) = (17,17, ..., 1%.) de R™ converja al pun- 
to b = (b,,b2,...,bm) es que cada una de las sucesiones componentes (x?) 
converja a la coordenada b; de b. 


Demostración. 

a) Supongamos que (£n) —> b. Probemos que (x?) > b; para cualquier 
índice i = 1,2,...,m. Sea e > 0, por hipótesis existe no tal que si n > ny se 
cumple ||x, — b|| < e. Por tanto, para todo n > ny se cumple 


|e? — bi] < llen = bl] < e 


b) Recíprocamente. Supongamos que (x?) — b; para cada i = 1,2, ...,m 
y probemos que (£n) > b. Sea € > 0, por hipótesis para cada 1 existe n; tal 
que 


si n > n se verifica |x? — b,] < e/ywm 
si n > na se verifica |13 — bo] < e/ym 


si n > Nm se verifica |1%, — bm| < e / ym 


Entonces si no = máx {N1, N2, ..., Nm}, para todo n > Ny se cumplen todas 
las desigualdades a la vez. Elevándolas al cuadrado y sumándolas 
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n 2 
E 
|En — b||? = ) (27 — bi)” <m> =e? 
pei e: 


con lo cual ||zn — bll <e. O 


El resultado anterior nos permite obtener, de manera obvia, a partir de 
las propiedades de las sucesiones de números reales, las propiedades corres- 
pondientes de las sucesiones en R”. Por ejemplo, si existe, el límite es único; 
o bien el límite de la suma de dos sucesiones convergentes es la suma de los 
límites. 


8.4. Ejemplos. 


J n =l 
a). La sucesión (2 37» Vn | converge a (0,3, 1) porque cada suce- 
am n*+<l 
sión componente converge a la coordenada correspondiente. 
2 





e l n 
b) La sucesión | —, 
m TM 
sucesión converge a oo. 


ya) no es convergente porque la segunda 


3. Límites y continuidad. 


En todo lo que sigue consideramos un subconjunto A de R”, un punto a 
de acumulación de A y una aplicación f : A — R, salvo que explícitamente 
se diga otra cosa. 


Definición de límite. Se dice que b es el límite de f(x) cuando z tiende 


a a, y se representa por lím r f(x) =b, si para todo e > 0 existe ô > 0 tal 
I>0, TE 


que si x E A yO< lx — all <ô, se cumple | f(x) — b] < e. 


«Definición de continuidad. Sea a € A. Se dice que f es continua en a 


si lím f(x)= f(a). Si f es continua en todos los puntos de A, entonces 
TM, TEA 


se dice que f es continua en A. 


En caso de ser A = R” o no existir confusión con el dominio A escribimos 
simplemente lím f(x). Por otra parte, si el espacio en el que toma valores f 
TSA 
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es R” y no R, las definiciones son las mismas sustituyendo el valor absolu* 
|. | por la norma || . ||. 


De manera análoga a lo que sucedía con las sucesiones en R”, 
Si f : A +R"”, entonces lím f(x) = b = (bı, bo, ...,bm) si y sólo s1 € 
TU 


límite de cada función componente f; es la coordenada correspondiente b, =- 
b, es decir, lím f(x) = bi. 
za 


La demostración es igual a la de la propiedad del límite de sucesiones y 
se deja como ejercicicio. 
Entonces, es claro que 


f es continua en a si y sólo si lo es cada una de sus componentes. 


Además, es evidente que se cumplen todas las propiedades de los límies 
estudiadas en el caso de funciones de una variable. Por ejemplo, si existe 
límite, entonces es único. 


La siguiente propiedad nos permite determinar con facilidad el pos 
candidato a límite o afirmar su no existencia en algunos casos. 


Límite a través de un subconjunto. Sea B un subconjunto de A 


a un punto de acumulación de B (y por tanto de A). Si lím f(r = 
T0, TEA 


t st lí b. 
entonces esiste lim i f(x) y vale 


Demostración. Sea € > 0. Por hipótesis, existe ô > 0 tal quesize Av < 
zx — all < ô, se cumple |f(x)— b| < £. Ahora bien, si x € B, forzosamer”- 
x E Á y por tanto para ese mismo ô se verifica que 


TeB,0<lzx=al <ó=>x€ A,|f() —b|<e 
es decir, ME Pae E 
Igual que en el caso de una variable, el límite de una función de vans 


variables se caracteriza por sucesiones. La demostración es idéntica a la d 
en el Capítulo 6. 


Caracterización del límite por sucesiones. Una condición nece: 


y suficiente para que exista lím i f(x) =b es que para toda sucesió 
TIM, TE 


de puntos de A, £n % a, tal que (£n) —> a se cumpla (f(x. )) > b- 


236 Capítulo 8 


8.5. Ejemplos. 
a) La función f : R? — R definida por 


Ly 


PA (z, y) # (0,0), F(0,0) =0 


f(x, y) = 


no tiene límite cuando (z, y) — (0, 0), pues si para cada A € R consideramos 
la recta By =[(x, y) ER? : y = Az), resulta 


(oa TA 4 


lí — E a: E 
(2.0.0), (2:9)€B, z>0 24 Ag  1+)32 


Por consiguiente, para cada recta y = Az tiene un límite diferente y sabemos 
que, si existe, el límite es único. Como consecuencia f no tiene límite y no 
es continua en (0, 0). 


b) La función f(x, y) = (Az, y), f(x, y), falz, y)) definida por 


f(x, y) = cos(x + y) 
= 55 si (5,9) % (0,0), F(0,0) =0 


tiene límite (1,0, 1) cuando (x, y) > (0,0) porque cada una de las funciones 
componentes converge a la coordenada correspondiente. Nótese que 





L == = = 0 < lí < lí 2 = 0 
DAA o o $ OA (zy) < T E 


Propiedades de los límites. Sean f y g funciones de A en R que 
poseen límite en A y a, p números reales. 


1. Existe lím(af + Bg)(x) = a lím f(x) + £ lím g(x). 
z—>a => zta 
2. Existe lím ae) lím dl) lím g(z). 


3.91 lím g(x) = b Æ 0 y g(x) 40, existe lím ERE) 
—0 


glz) 
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8.6. Ejemplo. 

* + sen (2? + y? 
Sy) AED 
sea continua?. Si f tiene límite en (0,0), definimos f(0,0) por el valor del 
límite y f será continua en el punto. 

La función es suma de dos funciones cada una de las cuales tiene límite. 
En efecto, 


, ¿podemos definir f en (0,0) de modo que 


4 4 


d Y y 2 
] ME <a De E 
coo 12 + y? 0 TS PS 
sen (12 + y? t 
ra, AA 
(2,y) (0,0) 124 y? t0 t 


por tanto, a L f(x,y) = 1, con lo que podemos definir f en (0, 0) 
2,y)> 
por 1. 


4. Diferencial de una función. 


Sea A un subconjunto de R” f : A > R, salvo que se diga otra cosa, 
y a un punto de A. Supongamos que se fijan en f todas las coordenadas 
del punto menos la que ocupa el lugar i. Si la función de una variable z; — 
f(a,, az, ...L;, ..., an) es derivable, su derivada en a; se dice que es la derivada 
parcial de f en el punto a y se representa por D;f(a) o bien por 5 2I. zla ). En 
caso de que existan todas las derivadas parciales de f en todos los Eis de 
A, a la aplicación Vf de A en R definida por 


v (¿DO DN) Dada) 
le llamamos gradiente de f. En Física se suele identificar con el vector 
Y D= OR DE, ..., Dar (2) 


Como no hay posibilidad de confusión utilizaremos indistintamente V f(x) en 
los dos sentidos. Si una aplicación g es el gradiente de f, es decir, si g = Vf, 
entonces decimos que g es una función potencial de f. 


238 Capítulo 8 


En caso de que todas las funciones componentes f = (fi, fo,..., fm) de 
una función vectorial f : A —> R”, tengan derivadas parciales en un punto 
z, entonces a la matriz 


DPI Dane Dilo) 
eE) Difalx) DaJa .. DRAT) 


Dsfmla) Dafmla) . Dnfm(z) 


se le llama matriz jacobiana de f en xz, y si m = n a su determinante se le 
llama jacobiano de f en z. 


Recuérdese que la matriz f'(a) define una aplicación lineal de R” en R”, 
cuyas funciones componentes son (V f,(a), V fala), ..., V fm(a)). 


8.7. Ejemplos. 


2 


a) Las derivadas parciales de la función f(x,y,z) = x?z — z? sen y en un 


punto genérico son: 
Dif(x,y,2) = 2x2, Dof(u, y, 2) =—2"cosy, Dif(x,y,2) = T’ — 225en y 


con lo que Vf(x,y,2) = (2x2, —2*cos y, 2? — 22 sen y). Por ejemplo en el 
punto (1,0,—1) su gradiente es Vf(1, 0, —1) = (-2, —1, 1). 


b) La matriz jacobiana de la función f(x,y,z) = (xy, 1y?2*) es 


2 
Fame) = (e y ) 


VE Mi Sy. 


y en el punto (—1, 2, 1) es 


TE 1) z ( e te E ) 





La información que nos proporcionan las derivadas parciales es muy es- 
casa. En el ejemplo siguiente veremos como una función puede poseer todas 
las derivadas parciales en un punto y no ser continuas en él. Esto conduce 
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a la necesidad de definir un concepto más fuerte, el de diferencial de la 
función en el punto, el cual nos proporciona una información sensiblem==- 
mayor. En lo que sigue, salvo mención expresa, A es un conjunto abier“. 
decir, cada punto de A tiene una bola contenida en A. 


8.8. Ejemplo. 


2 
La función f(x, y) = Le si (x,y) 4 (0,0), f(0,0) = 0 no es conti 
en (0,0) pues no existe su límite. En efecto el límite a través de la rec” 
z = 0 es 0 y a través de la parábola y = z? es 1/2. Sin embargo existen =" 


derivadas parciales. De acuerdo con la definición de derivada, se tiene 


Di fOO = im 46,0) — 40,0) — mE =0 
t>0 t t>0 t 

D2f(0,0) = tí £t) — £(0, 0) = Ed =0 
t>0 t t>0 t 


Definición de diferencial. Sea f : A > R” y a un punto de A tal : 
eriste f'(a). Se dice que f es diferenciable en a si 


im Ifet) — Fla) — PO 
h>0 [AII 


Como consecuencia de la definición, si f es diferenciable en a, su diferen- 
cial es la aplicación lineal definida por la matriz f'(a) y la representamos por 
Df(a). Por otro lado, teniendo en cuenta las propiedades del límite, 


fes diferenciable en a si y sólo si lo es cada una de sus componentes fi 


La demostración se propone en el ejercicio 10. 


Obsérvese que si n = m = 1, la derivada de la función coincide con su 
diferencial. 


Propiedades de la diferencial. 
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1. Continuidad. Si f es diferenciable en a, entonces f es continua en 


Demostración. Basta demostrarlo para una aplicación con valores en R. 
Como f es diferenciable, si 


Pe lo, 


ja Pe 


se tiene lím R(x — a) = 0. De la expresión anterior deducimos que 
z>a 


f(x) = f(a) + Vf (az — a) + ||z — all R(z= a) 


por tanto 


ím fe) = (a) + lim VÍ(0)(2—a) + lim la — all R@ — a) = Sa) 


z>0a 


ya que por ser Vf(a) una aplicación lineal, entonces es continua con lo que 
lím V f(a)(x — a) = 0. Por otro lado lím lIz—al| R(x—a)=0. E 
z>a zoa 


2. Diferencial de la suma. Si f y g son dos funciones de A en IR” 
diferenciables en a € A y a,ß dos números reales, entonces af + Pg es 
diferenciable en a y se cumple 


D(af + Bg)la) = aDf(a) + BDy(a) 


3. Diferencial del producto. Si f y g son dos funciones de A en R 
diferenciables en a € A, entonces su producto f.g es diferenciable en a y se 
cumple 


D(f.N(a) = f(a)Dg(a) + gla)Df(a) 


4. Diferencial del cociente. Si f y g son dos funciones de A en R 
diferenciables en a € A y g(x) 4 0 para todo x € A, entonces su cociente 
F/g es diferenciable en a y se cumple 


F\ e — KOD Fla) — Fla)Dla) 
í (5) ) PO 


D 





Funciones de varias variables 241 


5. Diferencial de una función constante. Si f es una funct - 
tante, entonces Df(a) =0. 


6. Diferencial nula. Si f es una función de R” en R tal que Df © = 
para todo x € R”, entonces f es constante. 


Demostración. Como Df(x) = 0, para cada i = 1,2,...,n la d::> 
0f(2;) 
OL; 


sea el punto (21, 12,..., £n) de R”. O 


parcial = 0. Por tanto f(11,Z2,..., £n) es constante cualqui-” 


7. Diferencial de una función lineal. Si f : R” => R” es =- = 
cación lineal, entonces Df(x) = f para todo x € R”. 


Demostración. Es evidente ya que por la linealidad de f se tiene 


Feth- Fa) -Eh _, 
[al 


Nótese que la matriz jacobiana f'(x) de f es f, es decir f'(x) = f. 


Las demostraciones de las propiedades 2, 3, 4 y 5 son análogas 
demostraciones de las propiedades para funciones de una variable. 


8.9. Ejemplos. 


a) Es muy sencillo demostrar por la definición que la función f(x. y.: = 
es diferenciable en cualquier punto (x, y, z) de R3, siendo su diferencial la a” - 
cación lineal definida por la matriz de las derivadas parciales ( 100 
forma análoga sucede con las funciones g(x,y, z) = y, y h(x,y,2) = :- En- 
tonces aplicando las reglas de cálculo anteriores, cualquier función polir“ 
ca es diferenciable en cualquier punto. Por ejemplo la función f(r.y.z = 
(1? + zy, zx — y?) de R? en R? es diferenciable en R? y su diferencial w 
dada por la matriz jacobiana 


fenaa (E 3, Y) 


z —2y r 
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b) La función del Ejemplo 8.8. tiene derivadas parciales ( 0 0 ) , pero 
no puede ser diferenciable en el punto (0,0) porque no es continua en él. Sin 
embargo es diferenciable en cualquier punto (x, y) 4 (0, 0) porque es cociente 
de funciones polinómicas y no se anula el denominador. Su diferencial en 
(x,y) viene determinada por la matriz 

_(Axt+yóxy— day (2t+y2x? — 20 %y? 
a E 


A continuación estudiamos una condición suficiente para que una función 
sea diferenciable en un punto. 


Condición suficiente de diferenciabilidad. Para que f = (fi, fa,..., fm) 
sea diferenciable en a = (a, a9,..., an) es suficiente que existan las derivadas 
parciales D¡f;(x) en un entorno de a y sean continuas en a. 


Demostración. Como f es diferenciable si y sólo si lo es cada una de sus 
componentes, basta probarlo para el caso m = 1. Además, para facilitar la 
notación supondremos f de dos variables, lo que no implica ninguna clase de 
restricción en el razonamiento. Sean a = (a1, a2), h = (hy, ho) y la identidad 


fla+h)-— f(a) = f(a1 +h1,02+h3)—f(01 +h1,t)+f(01 +h1,t) —f(a1, a2) 


Consideremos las funciones reales de una variable real 


g(t) = f(t,a2) — f(a1,a2) definida en fai, az + hı] 
g2(t) = f(ar + h1,t) — f(aı +h1,a2) definida en [az, az + ha] 


ambas son continuas en su intervalo de definición y derivables en su interior 
ya que f tiene derivadas parciales. Aplicando el teorema del valor medio para 
funciones de una variable 


g1(a1 + hı) — gi(a1) = higi (b1) 
g2(a2 + ha) — g2(a2) = haga(b2) 


en donde b, € (a1, a1 + hı) y ba € (az, az + ha). Sustituyendo en la identidad 
del principio resulta 


1) 
H 
(are) 


Funciones de varias variables 


fla+h)-— f(a) = hiDi f (c1) + haDaf (ca) 
ya que gi (b1) = Dı f(c) y ga(b2) = Daf (c2) en donde cı = (b1, a2) y & = 


(ai -+ hı, b2). 
Por consiguiente, teniendo en cuenta la última igualdad 


lf (a + h) — f(a) — hı Dı f(a) — haD2f(a)| 
1/1] 
— (Di flcs) — Di fla)) + ha(Daf (c2) — Daf(a))| 
1/1] 


< 1(D1f(c1) — Di f(a)) + (D2f (ca) — Daf(a))| 
ya que |h,| < ||A||. Ahora bien lle; — al] < ||A]|, si h => 0,entonces c; — a. 
Como por hipótesis las derivadas parciales son continuas, se tiene 

lím Dif(c1)=Difla) y lím Dsf (ca) = Dof(a) 
con lo cual 


Te Masa) 10) 110 M0) aa 


=0 
h>0 [17] 


que es la condición de límite de la definición de diferencial de la función. Ll] 
8.10. Ejemplos. 


a) Veamos en primer lugar que la condición anterior es suficiente, pero 
no necesaria para que la función sea diferenciable. Por ejemplo, la función 


f(x, y) = (1* + y”)sen si (x,y) # (0,0), F(0,0) =0 


g2 m y? 
es diferenciable en (0,0), pero sus derivadas parciales no son continuas. En 
efecto: 


y) # (0,0) 


D,fíz,y) = + 2x sen 


1 
— si (r, 


1 
tsen- 
t 


z 1 
JEA YN 


D1f(0,0) = 1 AA 


A 
t 


1 
= lím tsen- = 0 ya que 0 < 
t—0 t 
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y la derivada respecto a y es 


Dof(x, y) Sido g e 


2) y) 


D»f(0,0) = lím IPC) 


+ 2ysen 


1 


1 
= lím sen- = 0 ya que 0 < an 
t>0 t 





1 
tsen- 
t 





Dı f(x,y) y D2f (x,y) no son contiuas en (0,0) ya que no existen sus límites. 
En efecto, si consideramos la recta y = 0 


1 
lím Dıf(x,0) = A 
a 
y este límite no existe, ya que utilizando la caracterización del límite por suce- 
siones, para dos subsucesiones 2, = 1/21m, x;, = 1/(2rn +71 /2) tendiendo a 
0 se tiene dos límites distintos 





m — cos I = ím — cos 2mn = —1 
" 1 
Lim — COS 1/Qrn + 1/2) = lím = cos(2rn + 7/2)= 0 


De manera análoga se razona para Daf(x,y) considerando la recta x = 0 y 
después la sucesión £p = 1/(27rn + 7/2). 
Sin embargo se cumple la definición de diferencial ya que 


|f (hı, ha) id F(0, 0) = DIO 0)A1 Ei Dəf (0, 0)ha| 
(hx,h2) (0,0) [[(%1, ha) | 


o. 0,0) h? +h? ( ar 2)sen 





=0-=0 
hi + h 
1 1 
= AS A 
(ha) (0.0) 1 + hg sen PEE lím sz 


en donde se ha hecho y hi+ h? = t. 
b) La función de R? en R? definida por f(x,y) = (e”*Y, 2?y + y?r) es 
diferenciable en todos los puntos de R?, ya que sus derivadas parciales 
D¡fi(x, y) = Se Dafi(z, y) F A 
Dıfa(z, y) = 22y +y”, Dafa(z, y) = 1? + 22y 


si (x,y) 4 (0,0) 
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son continuas en cualquier punto. Por ejemplo la diferencial de f en (1, —1) 
es la aplicación lineal de R? en R? determinada por la matriz jacobiana 


a 


es decir la aplicación lineal de R? — R? 
1 1 
R E ha = (hı + ha, —(ha + ha)) 
-1 -—1 ha 


Si una función tiene sus derivadas parciales continuas en el entorno de un 
punto, se dice que es diferenciable con continuidad. 


4.1. Regla de la cadena. 


La composición de dos funciones diferenciables es una función diferencia- 
ble y su diferencial es la composición de sus diferenciales. Probaremos un 
caso particular, en el que, para facilitar la notación, supondremos funciones 
de dos variables. Su generalización a tres o más dimensiones es inmediata. Á 
continuación enunciaremos el caso general, cuya demostración se basa en la 
misma idea que la del caso particular aunque su complejidad es mucho mayor 
por la notación, la dimensión del espacio imagen y las hipótesis de partida. 


Regla de la cadena (caso particular). Sea f : R — R? diferenciable con 
continuidad en un punto a € R y g : R? > R diferenciable con continuidad 
en fla) = (b,c) € R?. Entonces F = go f : R — R es diferenciable en a y 
su diferencial es 


DF(a) = Dg(b,c)o Df (a) 


Demostración. Sea u € R, u Æ 0 y denotemos 


h= Aaa) fila); k= fle t u)— fla) 


con lo que 
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Fatu (fila +u), fola+u)) = (bh ck) 


Resulta la identidad 


F(a +u) — F(a) = g(f(a+u)) — g(f(a)) = g(b+ h,c+k) — g(b, c) = 


= g(b+ h,c + k) — g(b,c + k) + g(b,c + k) — g(b, e) 


Para k fijo consideramos la función de una variable t > g(t,b+k) a la que 
aplicamos el teorema del valor medio para funciones reales de una variable 
real en el intervalo fb, b+ h] y obtenemos 


g(b+h) — g(b) = Dig(€, c+ k)h 


en donde £ € (b,b + h). 
Por otro lado, aplicando el teorema del valor medio a la función t > g(b, t) 
en el intervalo [c, c + k], resulta 


g(b,c+k)— g(b,c) = Daglb, uk 


en donde y € (c,c+ k). 
Entonces, sustituyendo en la identidad, queda 


F(a+ u) -— F(a) = D19(€,c+ k)h + Dag(b, p)k 
Dividiendo por u y teniendo en cuenta los valores de h y k, se sigue que 
F(a+u)— Fla a+u)— fila 


E E a 2 =L 


Cuando u tiende a cero, h y k tienden a cero, € tiende a b y y tiende a c. 
Como las derivadas parciales son continuas, tomando límites en la expresión 
anterior cuando u —> 0, se tiene 


F(a) = Dig(b, c) fi(a) + Dag(b,c)fa(a) = Dg(b, c) o Df(a) 
como queríamos demostrar. C] 


Regla de la cadena (caso general). Sea Aun abierto de R” y B un 
abierto de R”, f una aplicación de A en B y g una aplicación de B en RP. 
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Si f es diferenciable en a € A y g es diferenciable en b = f(a) € B, entonces 
F =go f es diferenciable en a y DF(a) = Dg(f(a)) o Df (a). 


La demostración puede verse en [11]. Nótese que la técnica que utilizamos 
para derivar funciones reales de una variable es justamente la aplicación de 
la regla de la cadena. 


8.11. Ejemplos. 
a) Sean f(u,v) = (sen(u + v), v? +u — r?) y g(x,y) = (1?,2— y, £y + 
y3). Ambas funciones son diferenciables en todos los puntos de R? ya que 


sus derivadas parciales son continuas. Determinemos mediante la regla de la 
cadena la diferencial de F = g o f en el punto (0,7). Por un lado tenemos 


cos(u +u) cos(u +v -1 -—1 
DF(0,r) E ( E hs ) T ( il 2 ) 
(u,v)=(0,7) 


y por otro lado 


27 0 0 0 
Dg(F(0,m)) =Dg(0,0)=| 1-1 =| 1-1 
Y en) E 
con lo cual 
mo at) qm) sûp 
DEO m) AN =j ( a ) =| -2 -1-2 
0.0 y 0 0 


Obsérvese que hemos identificado las aplicaciones lineales Df(0, 7), Dg(0, 0) 
y DF(0,7) con las matrices que las determinan. 


b) Sean w= u(í,y),v = ux y) w = w(x, y) y sea 2 = 2(u,v,w). Cal- 
culemos las derivadas parciales de z = (u(x, y), v(x, y), w(x, y)) en un punto 
genérico (x,y). Apliquemos la regla de la cadena. 


du du 
dx Oy 
Gun OZ ? ðv ðv 
ðr 0y ) \ ðu ðv ðw ðr y 
ðw ôw 
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efectuando el producto e identificando los elementos de las matrices, resulta 


z _020u 0200 , 020u 
ðr dudx  0vódx ðw ðr 
dz _ ðzðu 0200, Öz dw 
Oy ððuðy vðy ðw dy 


Sea f : R” — R” una función diferenciable en un punto a tal que su 
matriz jacobiana f'(a) tiene inversa, y supongamos que f posee una función 
inversa g = f~’ diferenciable en b = f(a). Como la composición g o f de 
f y ges la función identidad 2, cuya matriz jacobiana es la matriz unidad 
de orden n, podemos determinar Dg(b) mediante la regla de la cadena . En 
efecto, como g'(b) f'(a) = I, multiplicando por la matriz f'(a)”*, resulta que 
g'(b) = f'(a)”?, por tanto. 


DE TODO S F D O o 


Aplicaremos este resultado en el cambio de variable que estudiaremos en 
el capítulo siguiente. 


4.2. Teorema del valor medio. 


El teorema del valor medio para funciones reales de una variable real se 
puede extender a funciones reales de varias variables, aunque no se cumple 
para funciones vectoriales. Para facilitar la notación en la demostración, 
enunciamos el resultado para dos variables, pero su generalización a más 
de dos variables es inmediata. 


Teorema del valor medio. Sea A un abierto de R? y f una función 
de A en R diferenciable en A. Si (a,b) € A y (h, k) € R? son tales que para 
todo t € [0,1] se tiene (a + th,b + tk) € A, entonces existe un número real 
0 € [0,1] tal que O < 0 < 1 de modo que 


fla+h,b+k)— f(a,b) = DFE, k) 
en donde Ẹ = (a + 0h, b + 0k). 


> e ús 
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Demostración. Consideremos la función g : [0,1] — A definida por g(t) = 
(a + th,b + tk). Es obvio que g es diferenciable en el intervalo (0,1) y su 


matriz jacobiana es g'(t) = ( 5 ) . Si F : [0,1] +R es la función de una 


variable composición de f y g, es decir, F(t) = f(g(t)), resulta que F es 
continua en [0,1] y derivable en (0,1). Aplicando a F el teorema del valor 
medio en [0, 1], tenemos 


F(1)— F(0) = F'(9)(1—0) en donde 6 € (0,1) 


Ahora bien, como F(1) = f(a + h,b + k) y F(0) = f(a,b) y por la regla de 
la cadena se verifica que 


DF(0) = Df(a + 0h, b+ 8k) o Dg(0) 


o lo que es equivalente 


F'(60) = ( Dif(a+0h,b+0k) D2f(a+0h,b+0k) ) ( A ) > 
= Dı f(a + 0h,b + 8k)h + Daf(a+0h,b+0k)k = DF(E)(h, k) 


en donde £ = (a + Oh, b + 0k), sustituyendo en la igualdad del valor medio 
de F, resulta 
fla + h,b+ k) — f(a, b) = DFE)(h, k) 


que es el resultado buscado. LJ 
8.12. Ejemplos. 
a) Apliquemos el teorema del valor medio a la función f(x, y) = 2? + y? 


en el intervalo [(0,0), (2, 1)] para determinar el punto (£1, 2) en el que se 
verifica 


12 1) = 0 0) Xx DE, E2)(2, 1) 


Por un lado, se cumple que 


5-0=( 2; 26) ( | )=46 +2 
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en donde (£,,€2) € ((0,0), (2,1)). Por tanto (€,,€2) pertenece al intervalo y 
por tanto a la recta de ecuación y = 2/2, con lo que también se cumple 
E = €,/2. Resolviendo el sistema, 


4€1 + 22 =5, E1 — 2€2=0 


resulta 61 = 1,8, = 1/2. 


b) Comprobemos que el teorema del valor no es cierto para funciones 
vectoriales. Sea f de R en R? definida por f(t) = (sent, cos t) y sea el intervalo 
[0,27] de R. No existe ningún valor de £ tal que f(27) — f(0,0) = F (t)2r. 


En efecto 
jon -100= (9) yro ( 2) 


—sent 


y no existe ningún ángulo t para el 


Pr RC G 


es decir, tal que cost = 0 y sent = 0. 


5. Derivadas de orden superior. El teorema de 
Taylor. 


Sea A un subconjunto abierto de R” y f una función de A en R. Su- 
pongamos que existe D;f(x) para todo z € A. Esto nos permite definir una 
nueva función g(x) = D,f(x). Si en un punto a € A existe la derivada par- 
cial Djg(a) a este número le llamamos derivada parcial segunda de f 
en a respecto a las variables que ocupan los lugares i,j y la denotamos por 


Fa), ð f(a) 1 


D; f(a). Otras notaciones son a Ima, Fees (a), fij(a), etc. 








Repitiendo este procedimiento podemos definir las derivadas parciales de 
cualquier orden. 


Si todas las derivadas de orden q existen en cada z € A y cada función 
derivada D;,:,...¡f es continua en A, entonces decimos que f es una función 
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de clase q en A. Si para cualquier número natural f es de clase q en A. 
entonces decimos que f es de clase infinito en A. 


El siguiente resultado expresa una condición suficiente para que las derivadas 
parciales cruzadas sean iguales. Su demostración puede verse en [11]. 


Igualdad de las derivadas cruzadas. Sea A un abierto de R? y f una 
función de clase uno en A. tal que existe Di2 f(x,y) para todo (x,y) € A y 
la función (x,y) > Diz f(x, y) es continua en el punto (a,b) de A, entonces 
existe Da f(a, b) y se cumple que Da, f(a, b) = Di2 f(x, y). 


El resultado anterior es cierto cualquiera que sea el número de variables. 
Si A es un subconjunto abierto de R”, a = (a;,az,..., a.) un punto de A 
y f una función de A en R, que cumple las correspondientes hipótesis del 
teorema anterior, entonces, cualesquiera que sean los índices 2, j, se tiene 


Di; f(a) = Dj¡f(a) 


En efecto, aplicando el resultado anterior a la función de dos variables 


(2-0) > E e a a UU E 


en el punto (a;, aj).resulta 


Di¡f(a) = Diagla) = DOO DO) 


8.13. Ejemplos. 


a) Sea f(x, y, z, u) = 1%u?*+2*y?—2xyzu?. Comprobemos que las derivadas 
Də4f y Da2f son iguales en todos los puntos de R*. En efecto 


D f(r, Y, 2, u) m a ar“ 203 Dafiz,y,z, u) = —2rzu 


Daf (x,y,z, u) = 2z°u — 2ryzu; Dyf(x, y, z, u) = —2rzu 


b) Si no se cumplen las hipótesis puede ocurrir que las derivadas cruzadas 
sean distintas. La función de R? en R definida por 


yoi 
r? +y? 


Fx, y) = zy si (x,y) # (0,0); f(0,0)=0 
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es de clase uno ya que son continuas sus derivadas primeras 


ylat+40y*—y%) 


Di f(x, y) = (x? + y?)? si (x, y) F (0, 0); D1f(0, 0) Y 
a o 
Dafa) = O s (28) 400,0); Daf(0,0) =0 
sin embargo 
Dafio,0) =p LO) DIO0) - y 
Da F(0, 0) 2 lím Daft, 0) F Dəf (0,0) =a 


con lo que D12 f (0,0) 4 Dz f (0,0). La hipótesis del teorema que no se cumple 
es la continuidad de las derivadas segundas en (0, 0). 


5.1. El teorema de Taylor. 


Igual que en el caso de una variable, el teorema de Taylor permite apro- 
ximar la función en el entorno de un punto por una función polinómica. Su 
demostración se basa en el teorema de una variable y utiliza la misma técnica 
que la empleada en la demostración del teorema del valor medio. Recordemos 
que: Si f es una función de un abierto A de R en R, m+ 1 veces derivable 
en [a,a+h] C A,h E R, entonces existe 0 € (a,a + h) tal que 


1 


(m +1) OS 


Mar) = oa) 


En el teorema utilizaremos la notación de sumatorios del tipo 


NN A e MD 


11,12,--.,tp=1 


respecto a p Índices 11, 12, ..., 1p cada uno de los cuales toman todos los valores 
entre 1 y n. Su significado es el siguiente: la suma para todas las pemutaciones 
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con repetición de los elementos del conjunto {1, 2, 3,...., n}. Por ejemplo, para 
dos índices 1, J, si también es n = 2, se tiene 


2 
5 hah D; f(a) = hi ha Di1f(a) + hi h2D12f (a) + hoh; Da f(a) + ho haD f (a) 


ij=1 


Teorema de Taylor. Sea A un abierto de R” y f : A — R de clase 
m+1 en A. Si ja,a +h] es un segmento contenido en A, entonces existe 
E€ (a,a + h) tal que 


Ha+h)=$(0) +3 En Dif(a de har Dis, $ (a) + 


P 19=1 
n 


— ` MD a O) JF Rm+1 


i i2, m= l 
en donde 


n 


1 
Rm+1 = aa pra y a EL MS 


ato ll 
se llama resto de Lagrange. 


Demostración. Obsérvese en primer lugar que a = (a, az,..., dy) es un 
punto de A y h = (hı, ho, ..., hn) E R”. Sea g : R — R” definida por 


g(t) = (ar + thi, a2 UN tho, «»=3 An Alun) 


La función g es de clase infinito ya que cada componente es un polinomio 
de grado uno de la variable t. Además como g([0,1]) = [a,a + h] , se cumple 
que [0,1] € g7! (A). Por lo tanto la función composición F = f o g, definida 
por F(t) = f(a + th), es de clase m + 1 y le podemos aplicar el teorema de 
Taylor para funciones de una variable en el intervalo [0, 1] 


1 


ON T (0) 


F(1) =F(0) + F0) + AO To PU) Bl 


en donde 0< <1. 
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Si calculamos las derivadas F*(0), F"(0),.... F™ (0), FM+D(O) y sustitui- 
mos en la fórmula de una variable, obtenemos la expresión del enunciado. 
Utilizando la regla de la cadena, resulta 


F'(t) = Df(a + th) o Dalt) a 


21 =1 


Derivando de nuevo obtenemos 


F"(t <= hs, [VD;,f(a ++th)] 25 EN 3 haie pla th) 


i=l t1i=1 i9=1 


= > EDO T th) 


11,12=1 


Derivando sucesivamente, la derivada de orden r, con 1 < r < m + 1, viene 
dada por 


n 
EN (t) = a hi, Bae ar Daoa d =p th) 
61,12)... ¡bp=1 
cuya demostración por inducción es inmediata ( el razonamiento para pasar 
de F"=1 a F") es el mismo que hemos hecho para pasar de F’ a F” ). Par- 
ticularizando para t = 0 todas las derivadas F”(t) hasta r = m y F™+D(¢) 
para t = 0, si sustituimos en la fórmula de Taylor de F en [0, 1] del principio, 
resultan las expresiones del enunciado, en donde £€ =a + 06h. O 


Igual que ocurría en el caso de una variable, al polinomio de grado m en las 
variables hy, h2, ..., An que aparece en lá fórmula le llamamos polinomio de 
Taylor de orden m de f en el punto a y lo designamos por P.(h1, ha, ..., An). 
El error cometido al aproximar f por Pm en un entorno de a es menor que 
cualquier cota del resto en ese entorno. 


En cada término del polinomio de Taylor, el sumatorio 


n 


n= MARDI a la 
1 2 1,42)---3ly 


an 


tiene todas sus derivadas cruzadas iguales por lo que su expresión se puede 
simplificar. En efecto, si (11,12, ..., ir) y (J1, J2, ---, jp) son los mismos índices 


Funciones de varias variables 255 


colocados en distinto orden, es decir difieren en una permutación, el teorema 
de igualdad de las derivadas cruzadas nos permite afirmar que Dj, yo ....;. f (4) = 
Di iz,...i (a). Como consecuencia podemos utilizar la notación simbólica 


FU) =(MiD1 + hoDa +... EhD Fla) 


en donde el desarrollo de (hı Dı +h2D2 +... +hn Dn)” se realiza por la fórmula 
de Newton, definiéndose el producto 


(hiDi)(h;D3) = hihi Dij 
Por ejemplo 
(hı Dı + ha D2} f (£) = RD f(x) + 2h1h2D12 f(x) + hè Da f(x) 
Con esta notación la fórmula de Taylor para una función de dos variables en 
un punto (a, b) es 
1 1 
fla+h,b+ k) = f(a,b) + qP: + kD3)f(a,b) + OD, + kD} f (a,b) +.. 
1 
+ miD: + kDa)” f(a, b)) aP ml 
en donde 
e 1 E m+1 
Rm = mr T ODR 
y E = (ai + 0h, a2 + 0k) con 0 <0 <1. 


Al desarrollo de Taylor de la función en el origen también se le llama 
desarrollo de Mac Laurin. 


8.14. Ejemplos. 


a) Desarrollemos el polinomio f(x,y) = 2%y + 3y — 2 en potencias de 
(x— 1) e (y + 2). Esto es equivalente a desarrollar por la fórmula de Taylor 
la función f en el punto (1, —2). Calculemos las derivadas 


Dif(2,y) =2wy, Daf(a,y) =x* +3 
Di f(x, y) = 2y, Di2f(x, y) = 21, Da2f (x, y) =0 
Di f(x, y) = Da2 f(x, y) = Diz f(x, y) =0, Dif (x, y) =2 
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y todas las derivadas sucesivas son nulas. Particularizando para el punto 
(1, —2), se tiene D, f(1,—2) = —4, Daf(1,-2) = 4, Dı f(1, —2) = —4, 
Di2 f (1, —2) = 2% Da2f(1, —2) = 0 y Di12f (1, —2) = 2. El desarrollo de 
Taylor es 


fc,y) =$(1,-2) + 5 4e — 1) +4(4 +2) 


91 [—4(x — D +4(x — 1)(y + 2)] + 53 x 2 — 1)?(y +2) 
= —10 — 4(x — 1) + 4(y +2) — 2(z — 1)? 
+ 2(x2 — 1)(y +2) + (z — 1) (y +2) 


1 
q 


Obsérvese que h = z—1 y k = y+2. Además el resto es cero. Si efectuamos 
las operaciones obtenemos la expresión original del polinomio. 


b) Calculemos el polinomio de Taylor de orden tres de f(x, y, z) = er+v+? 
en el punto (0, 0, 0). 


1 1 
Pola,y 2) =14+ (04942) + (04942) + (0+y+2) 


A 
ya que las derivadas de cualquier orden valen todas e*+Y+* y en (0,0,0) valen 
i 


Dı f(z, y, z) = Daf (x,y,z) = Daf (£, y, 2) = ... = e tur 


El resto es R4 = 4ef1+$2+63, en donde (£1, €2, £3) es un punto del intervalo 
(0,0 Olea El desarrollo es válido para cualquier bola abierta de cen- 
tro (0, 0,0) (en cualquiera se cumplen las hipótesis del teorema) y por tanto 
es válido para R*. Una cota del error cometido al aproximar f(x,y,z) por 
Ps(x, y, z) en la bola de centro (0,0,0) y radio 1, viene dado por 


1 1 
ee e 
24 24 
aunque la menor cota se calcula mediante el punto de la esfera 124442? = 1 


en el que la suma 1 + y + z alcanza su mayor valor, en este caso el punto 


[Ral = [27 - e1 +82 +63 








(5 E 4) Entonces el valor de la cota es ev v3, 
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5.2. Extremos relativos. 


Un punto a de R” decimos que es un punto de máximo (mínimo) 
absoluto de la función f de R” en R si f(a) > f(x) (f(a) < f(x)) para todo 
x € R”. Si la desigualdad es estricta decimos que a es un punto de máximo 
(mínimo) absoluto estricto. 


Un punto a decimos que es un punto de máximo (mínimo) relativo o 
local de f si existe un entorno V de a tal que f(a) > f(x) (f(a) < f(x)) para 
todo x € V. A estos puntos les llamaremos también extremos relativos. Si 
la desigualdad es estricta, a es un punto de extremo relativo estricto. 


A continuación estudiamos condiciones que nos permiten deteminar los 
puntos de extremo relativo de una función real definida en un abierto A de 
R”. La demostración de las condiciones las haremos a partir de las correspon- 
dientes propiedades para funciones de una variable. Utilizaremos la misma 
técnica que la empleada en la demostración de los teoremas del valor medio 
y de Taylor, es decir, definiremos una función real a partir de una función 
vectorial y aplicaremos los resultados. Recordemos que si J es un intervalo 
abierto de R, a un punto de I y f una función de / en R, se tiene: 


1. Condición necesaria de extremo. Si a es un punto relativo de f, en- 
tonces f'(a) =0. i 


2. Condición suficiente de extremo. Supongamos que f'(a) =0 y f tiene 
derivada segunda en a. Si f”(a) > 0, es un mínimo local y si f"(a) < 0 es 
un máximo local. 


En todo lo que sigue f es una funcion definida y de clase dos en un abierto 
A de R”. 


Condición necesaria de extremo. Si a € A es un punto de extremo 
relativo de f, entonces f'(a) =0. 


Demostración. Sea g : R —> R” definida por g(t) =a + th 

La función g es de clase infinito ya que cada componente es un polinomio 
de grado uno de la variable t y g(0) = a. La función composición F = f og, 
definida por F(t) = f(a+th) es derivable en t = 0. Si a es un mínimo local de 
f existe r > 0 tal que la bola B(a,r) está contenida en A y f(a+th) > f(a) 
para todo a + th € Bla, r). 
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Como g es continua en A la imagen de la bola abierta es un conjunto 
abierto y por tanto U = g”*(B(a,r)) es un entorno del punto t = 0 de R, 
con lo cual si t € U, se cumple 


F(t) = f(a+th) > f(a) = F(0) 


y por consiguiente t = 0 es un mínimo local de F, con lo que F"(0) = 0. 
Teniendo en cuenta que g'(t) = h para todo t, por la regla de la cadena 


F'(0) = Df(a) o Dg(0) = Df(a)(h) =0 


se verifica para todo vector h, con lo que necesariamente Df(a) = 0, es 
decir todas las derivadas parciales de f son cero, D¡f(a) = 0 para todo 
¡=1,2,...,n. El razonamiento es el mismo si suponemos que a es un máximo. 


E] 


Un punto a en el que todas las derivadas parciales de una función dife- 
renciable son nulas, D¿f(a) = 0, o lo que es equivalente D f(a) = 0, decimos 
que es un punto crítico. 


Como hemos supuesto que f es de clase dos en A, podemos asociar a la 
función en cada punto a una forma cuadrática Q(a,-) determinada por los 
valores de las derivada parciales segundas 


Q(a, h) = y hih; D fiza) 


1,j=1 


a partir de la cual se enuncian las condiciones suficientes para que un punto 
crítico sea extremo relativo. Obsérvese que el polinomio anterior representa al 
término de segundo orden del desarrollo de Taylor. Por otra parte, la matriz 
de la forma cuadrática ((a, -) 


Dafa) Diefla) = Dita) 


Hf(a) = Da f(a) Də f(a) k Don f (a) 


DN O DO 


recibe el nombre de matriz hessiana de f en el punto a y su determinante 
se llama hessiano. 
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Condición suficiente de extremo. Supongamos que a € A es un punto 
enticowesideein D¡Play= 0 para todo i= t2., n. Se. cumple: 

i) Si Q(a, h) > 0 para todo h € R” — {0} (definida positiva), entonces a 
es un punto de mínimo relativo estricto. 


ii) Si Q(a,h) < 0 para todo h € R” — {0} (definida negativa), entonces a 
es un punto de máximo relativo estricto. 


Demostración. Si desarrollamos f por la fórmula de Taylor en un entorno 


B(a,r) de a 


Da E ¡—0:)Dfa) + yy Se — a) D fij (Ex) 


1,j=1 


en donde £; es un punto del intervalo (a, x). Si a es un punto crítico, entonces 
Df;(a) =0 para todo ¿= 1,2,...,n. y resulta 


f(x) — f(a) = DN z; —a)Dfy(ts) = 0 (Ex, T — a) 


i, j=l 


Por la continuidad de las derivadas parciales segundas, existe una bola B(a, ô), 
con radio ô < r, tal que para cualquier € € B(a,ó) el signo de la forma 
cuadrática Q(£,-) es el mismo que el de la forma cuadrática Q(a, -), y como 
consecuencia, si Q(a,h) > 0 para todo h € R” — {0}, entonces Q(€,h) > 0 
para todo h € R” — {0} , con lo cual resulta 


1 
f(e) = H(a)=5Q(t.,2a) > 0 
para todo x € B(a, ô), x % a. (Obsérvese que h = q — a). 
De forma análoga se razona el caso de máximo. Él] 
Los detalles de que Q(£,-) y Q(a, -) tienen el mismo signo pueden verse 
n [11]. 
En resumen la forma de proceder para estudiar los extremos relativos de 


f en A es la siguiente: 


1. Se resuelve el sistema Df,(1) = 0, Dfalz) = 0, ...,D fa(£) = 0 para 
encontrar los puntos críticos y por tanto los posibles candidatos a extremo 
relativo. 
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2. Se estudia si la matriz hessiana en cada uno de los puntos críticos a 
define el signo de la forma cuadrática GQ (a, h) y se puede aplicar la condición 
suficiente. 


Recuérdese que si Az = deter(D,¿f(a, h)), 1 < i,j < k, se cumple: 
i) Az > 0 para todo k = 1,2,...,n, entonces Q(a, h) es definida positiva. 


ii) (—1) A, > 0 para todo k = 1,2,...,n, entonces Q(a, h) es definida 
negativa. 


En el caso particular n = 2, es decir, si la función f es de dos variables, 
y a = (a¡,a2) es un punto crítico, la matriz hessiana de f en a viene dada 


por 
O O LS IA 
romh Da Dri Jl) 
y la forma cuadrática por 


Q(a, h) = rh? + 28h1ha + th5 


entonces se puede cumplir uno de los casos siguientes: 
1. rt— 3 > 0. Existe extremo relativo. 


Si r > 0, la forma cuadrática es definida positiva y a es un mínimo. 
Si r < 0, la forma cuadrática es definida positiva y a es un máximo. 


2. rt— 32 < 0. No existe extremo relativo. 


En efecto, la forma cuadrática no tiene un signo definido. 
i) Sir 40 y consideramos (hy, h2) = (—shg/r, hay), ha # 0, entonces 
_ rs ha Eh 


1 
E 2 2 
Aah) -2 F ai = =A -= rt)h 





y Q(a, h) tiene el signo contrario a r. En cambio si consideramos (h, h2) = 
(hı, 0), hı 4 0, entonces i 


Q(a,h) =rhi 
y Q(a, h) tiene el mismo signo que r. 


ii) Sir = 0 y t 40, consideramos (h1, h2) = (hi, —sh1/t), hi 40 y 
(h1,h2) = (0, h2) y razonamos de la misma manera. 
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iii) Si r = t = 0, entonces Q(a, h) = 2shıhz evidentemente cambia 
de signo. 


3. rt — 32 = 0. Puede existir o no existir extremo relativo. 
Por ejemplo la función f(x,y) = y(x? + y), tiene como punto crítico 
(0,0), r = s = 0, t = 2 y (0, 0) no es extremo ya que en un entorno del punto 
tan pequeño como queramos f toma valores positivos para el punto (€, €) y 
negativos para el punto 


(VE +u, —E) , € > 0, u > 0, pues (ye + p, —€) = —ep. 


Los puntos críticos que no son extremos relativos se llaman puntos esta- 
cionarios. 


8.15. Ejemplos. 


a) Los puntos críticos de la función f(x,y) = 2x? + y? + x’y son las 
soluciones del sistema 


Dfilx, y) = 4x + 2xy =0 
Dfa(z,y) =2y+1*=0 


P, = (0,0), Pa = (2, —2) y P = (-2,—2). Estudiemos las matrices hessianas 
en cada punto. 


Como 
Dfu(z,y) =4+2y, Dfiz(z,y) = 2x, D falz, y) =2 
resulta 
; 4 0 
rt = s“ = det A F(0,0) = 02 =8:>0 
y r = 4 > 0, el punto (0,0) es un mínimo. 
; 0 4 
rt— só = det H f (2, —2) = R = —16 < 0 


(2, —2) no es extremo relativo y por tanto es un punto estacionario. 


O —4 


= RE — — = 
rt — s = det H f(-2, —2) = ) 


|=- <0 
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(—2, —2) no es extremo relativo y por tanto es un punto estacionario. 


b) Sea f(x, y, z) = 21?+y*+32?—22y-—2y2+3. Estudiemos la existencia 
de extremos locales de f. Los puntos críticos son las soluciones del sistema 


Df(=,y,z) =40 — 2y=0 
Dhla 215 205 200 
Dfs(x,y,2) =62-— 2y =0 


Su única solución es (0,0,0). Las derivadas segundas en el punto son 


Dfa1(0,0,0) =4, Df12(0,0,0) =-—2, Dfi(0,0,0) =0 
D fo2(0, 0, 0) T 2, D fo3(0, 0, 0) = a D f33(0, 0, 0) =6 


y la matriz hessiana 


4 —2 0 
HATOT oS =D 
0-2 6 
con lo que 
a 8 4-2 0 
ArmA = =4>0, AS —2 2 -2|=8>0 
p” WA 


la forma cuadrática es definida positiva y (0, 0, 0) es un mínimo local estricto. 
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Ejercicios y cuestiones propuestos 


1. Resuélvanse las siguiente cuestiones: 

a) Pruébese que u - v = 0 si y sólo si [Ju + v|| = [Ju — v| . 

b) ¿Se encuentra el punto (1, 0, —1, 1) en la bola abierta de centro (2, 1, —1.2) 
y radio 37. 

c) ¿Cuál es el seno del ángulo que forman los vectores (1, 2, —1) y (—1, 1, 0)?. 


d) Pruébese que el conjunto de los vectores ortogonales a uno dado es un 
subespacio vectorial. 


e) Encuéntrese la ecuación del subespacio de R* ortogonal a (1, 1, —1, —1). 


2. Se llaman cosenos directores de un vector a los cosenos de los ángulos 
que forma con los vectores de la base canónica. En el espacio R, si re- 
presentamos por {i,j,k} los vectores de la base canónica y por a, 6 yy los 
respectivos ángulos que forma con ellos el vector v = ai + bj + ck, pruébese 
que cos? œ + cos? 8 + cos? y = 1. 


3. En su caso, calcúlense los diámetros de los siguientes conjuntos, y 
estúdiense si son abiertos, cerrados o ninguna de las dos cosas y señálese su 
interior, exterior y frontera. 


a) M=( (2,1) ER: 0246 <1). 
DUL- {0 PERE ER EY. 

o Mo € Roy ea <0l). 

d) o (my ER 2 sr <31<y<t. 
SIMI MY, 2 E RT F y 2=1T. 
DU o ER 7 =270<y € LY. 


4. Determínense la adherencia y acumulación de los conjuntos del ejercicio 
anterior. 


5. Razónense las siguientes cuestiones: 
a) Una bola abierta es un conjunto abierto. 
b) Una bola cerrada es un conjunto cerrado. 


c) ¿Quién es la frontera de una bola abierta? y ¿de una bola cerrada”, 
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d) ¿Es la unión de una colección numerable de bolas cerradas disjuntas 
dos a dos un conjunto cerrado?. 


6. Si existen, determínense los límites de las siguientes sucesiones. 
n+1 n+1 

a) (AE) 

b) == 044. +2m)). 


Inn n3 


n-1 
n?+n p n 
o) (2) 2). 
7. Resuélvanse o razónense las S cuestiones: 
1 
Es 3, 5,1, EE, EE 
b) Determínense dos subsucesiones de (%3*). 








a) La sucesión 1, 3 no es convergente. 


c) Determínese un valor de n a partir del cual 2 QU 
d) Determínese un valor de n a partir del cual [2H = 1| <10, 


8.. Pruébese que no existe o determínese el límite de f en (0,0) en los 
siguientes casos: 


3a 2 dl 
n= E C a 
3 
c) f(a,y) = a ys d) fley) == 


u= ro 
e) f(x, y) = 1 a si (x, y) 7 (0, 0), f(0, 0) = 
f) f(x, y) = log(z? + y”) si (z, y) # (0,0), f(0,0) = 0. 


9. Sea f(x,y) = g(x), en donde g es una función derivable en todo R. 
Pruébese por la definición que f es diferenciable en R?. 


10. Demostrar que f : R” — R” es diferenciable en a si y sólo si f; es 
diferenciable en a para cada i = 1,2,...,m. 
Observación. Téngase en cuenta que 


fila +h) = fila) - VFilah)| _ lfl +h) - fa) - Fawl 

a ` liz y 
< la + h) - fila) - V fila) (h)| y [mla + h) — fmla) — V frla) (h)| 
y Iiz 17] 


0< 
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11. Estúdiese la continuidad en R? y, si existen, calcúlense las derivadas 


parciales de la funciones en el punto genérico (x, y). En su caso, ¿cuánto valen 
D,f(0,0) y Daf (0,0)?. 


y? sa r3 y 
a) f(x,y) > 1224 y? S1 (aa) A (0, 0), F(0,0) = 0. 
2 
b) f(e) = zz a S (2,4) # (0,0), F(0,0) = 0. 
2 
c) f(z, y) = e si (2, y) # (0,0), F(0,0) = 0. 


d) f(2,y) =2%,x>0. 


12. Determínense las matrices jacobianas en (x,y) de las funciones: 

a) fu, y,2) =(2*+y?4 2%, senzyz, In(1 +2” + y?) 

b) f(x, y, 2,u) = (zzu, e”, u+ tag (2 — 2y)). 

13. Estúdiese la continuidad y la diferenciabilidad en su dominio de las 
siguientes funciones. En su caso, determínese la diferencial. 


a) f(x, y) > VE + si (x, y) E (0, 0), (0,0) =0. 


r3? 


c) (£, y, z) = 2*7, 2 > 0. 


DanS z]. 


e) f(x,y) = sysen = si y £ 0, f(x,0) = 0. 


b) f(x,y) = 


14. Sean f(x, y, 2) = Ay rya =r) y g(u, v, w) = (cos(u +), e”). 
Pruébese por la regla de la cadena que g o f es diferenciable en cualquier 
punto (x,y,z) de R? y calcúlese su diferencial en el punto (0, yr, y). 


o 0 
15. Sea u = F(zu, y + u). Determínense E y = en función de las 
T y 
derivadas de f. 
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16. Determínese (€, €2) de modo que se cumpla el teorema del valor medio 
de f(x,y) = 2? + y? en el intervalo [(0, 0), (1, 2)]. 


17. Determínense todas las derivadas hasta las de orden 6 de la función 
f(£,y, z) = y?z?e” + 222%eY y compruébese que las derivadas cruzadas son 
iguales. Razónese que la función es de clase infinito. 


m+n 
18. Determínese -— siendo F = go f, en donde g es una función real 


Ox 
de clase infinito y f(x,y) = az + by + c. 


19. Si existen, determínense las derivadas D11 f (0,0), Di2 f (0, 0) y D22 f (0,0), 


en donde 
2 


Hay) =y—2 si (2, y) # (0,0), f(0,0)=0 


zx? + y? 


Estúdiese la clase de f en R?. 


20. Desarróllese por el teorema de Taylor las funciones siguientes hasta el 
resto de orden 4 en la bola B(a,r) y encuéntrese una cota del resto. 


a) f(x,y) = Y y+3y-2, a=(1,-2),r=1. 
b) f(x,y,2) =1y+yz+2x, a=(0,-1,0), r =2. 
c) Fay 2) =y 2 PERRO A r 


21. Respóndase a las siguientes cuestiones: 
a) ¿Cuánto vale f”(t) si f(t) = (x(t), y(t), z(t))?. 
b) Determínese una cota de error al aproximar en B((0,0), 1) la función 


f(x, y) = cos sen y por su polinomio de Taylor de orden tres. 
PP... DO, O AN YTY 

c) ¿Cuánto vale la laplaciana Da2 + dy? aj T de la distancia de un 
punto al origen?. 

22. Determínense los máximos y mínimos locales de las funciones: 

Die u 2) =2% +2 %y+y. 

b) H(x,y,2) =2*+y* +2 + 2yz. 

c) f(x, y) = 22° + y*+<%y. 


23. a) Determínese la mínima distancia del punto (0,2) a la parábola 
DOE Ay. 
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b) Determínense los extremos de f(x,y) = zy con la condición de que 
a+y=1. 

c) Determínense los extremos de f(x,y,z) = 5 + 2?y?2? con la condición 
de que z? + y? + 2? =1. 


24. Determínese el volumen de un paralelepípedo de dimensiones z, y,z 
con la condición de que su área sea mínima. 


25. Si y es una función de x, determínese y'(x) e y”(x) sabiendo que se 
cumple la ecuación y? — xy? + a%y — a? = 0. (A esta forma de derivación se 
le llama derivación implícita). 





Capítulo 9 
La integral múltiple 


1. Introducción y objetivos. 


El área de un recinto plano limitado por el eje Oz, las rectas x = a, x = b 
y la curva y = f(x) definida en el intervalo [a, b], condujeron al concepto de 
integral simple (Figura 1.a). El cálculo del volumen de un cuerpo limitado 
por los planos z = 0,  =a,x =b y =C, y = d y la superficie 2 = f(x, y) 
definida en el rectángulo fa, b] x [c, d], conducen al concepto de integral doble 
(Figura 1.b). En ambos casos las condiciones son análogas y la definición de 
integral doble es una generalización inmediata de la integral simple. 


y=f(x) 





FIGURA 1. 
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Posteriormente veremos que la generalización de la integral a funciones 
de n variables, integral múltiple, es también inmediata, que los resultados 
son los mismos y únicamente hay que contemplar el diferente número de 
variables. De esta manera hablamos de integrales triples si n = 3, integrales 
cuádruples si n = 4, etc. 


La condición de Riemann que caracteriza las funciones integrables es tam- 
bién una extensión trivial de la demostrada para funciones de una variable. 
La medida en el plano es el área, en el espacio es el volumen, y el teorema 
de Lebesgue tiene idéntico enunciado. 


Dado un subconjunto M, la función que vale 1 en los puntos de M y 
0 en los puntos de su complementario se llama función característica de 
M. A partir de ella, bajo determinadas condiciones, podemos extender la 
integración a conjuntos acotados más generales que los rectángulos. 


La herramienta básica para el cálculo de integrales dobles, y en general de 
integrales múltiples, es la integración reiterada, que nos permite reducirlo 
al cálculo de integrales simples. 


Otra cuestión importante es el cambio de variables. Para abordarlo enun- 
ciamos el teorema de la función inversa. La idea es exactamente igual que en 
el marco de una variable. El teorema del cambio de variable nos proporciona, 
igual que allí, un método para transformar las integrales en otras equivalentes 
de resolución más sencilla. Se estudian las coordenadas polares, cilíndri- 
cas y esféricas y se exponen los cambios correspondientes. 


1.1. Comentario sobre curvas y superficies. 


En el cálculo de integrales dobles y triples aparecen curvas y superfi- 
cies que limitan los recintos de integración. De manera intuitiva entende- 
mos una curva C como la trayectoria que describe en el plano o en el 
espacio el movimiento de una partícula. Cada instante t tiene asociado el 
punto de posición de la partícula r(t) = (x(t), y(t)) en el plano o bien 
r(t) = (x(t) y(t), z(t))) en el espacio. De la misma forma, es conforme a 
nuestra intuición que la partícula no pueda desaparecer, pararse u ocupar dos 
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posiciones distintas en un tiempo tan pequeño como queramos. Por ello a la 
aplicación t —> r(t), definida en un cierto intervalo / de tiempo la suponemos 
continua e inyectiva en un entorno de cada instante ty € J. A r(t) le llamamos 
representación paramétrica de la curva y a x = x(t), y = y(t), z = z(t) ecua- 
ciones paramétricas. 


Del mismo modo podemos considerar una superficie S como el lugar 
geométrico de los puntos que ocupa una partícula que se mueve con dos 
grados de libertad. La posición de la partícula viene dada por una función 
r(u,v) = (z(u,v), y(u, v), z(u, v)) cuyas variables u,v toman valores en un 
subconjunto G del plano, o bien en G y su frontera, en donde dos puntos 
cualesquiera de G pueden unirse por medio de una curva. A estos subcon- 
juntos de R? les denominamos regiones, e igual que en el caso de las curvas. 
suponemos que la función r es continua e inyectiva en un entorno de cada 
punto (u,v) € G. A r(u, v) le llamamos representación paramétrica de la su- 
perficie y a x = z(u,v), y = y(u,v), z = z(u,v) ecuaciones paramétricas. 


1.2. Objetivos. 


. Calcular sumas superiores e inferiores de Riemann. 

. Estudiar aplicando la definición si una función es integrable. 

. Determinar si una función es integrable en un recinto acotado. 
. Calcular integrales mediante integración reiterada. 

. Reconocer si las funciones son cambios de variables. 

. Determinar los recintos transformados. 


. Efectuar cambios de variables en las integrales dobles y triples. 


Y 54m "o 5 


. Efectuar cambios a coordenadas polares, cilíndricas y esféricas. 


9. Determinar si los recintos son proyectables y los límites de integración 
correspondientes. 


10. Calcular longitudes, áreas y vólumenes. 
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2. El concepto de integral doble. 


Sea f una función real definida y acotada en el rectángulo A = [a,b] x 
[c,d]. Una partición P del rectángulo A es una colección de puntos P, x 
P, en donde P, es una partición de [a,b] y Pz es una partición de [c, d]. 
La partición P determina en A una familia de subrectángulos (Figura 2) 
cuyo elemento genérico representamos por Q. Como f es acotada en cada 
subrectángulo Q, existe en Q su supremo, que designamos por M(f,Q), y 
su ínfimo, que designamos por m(f,Q). Si denotamos por |Q| el área de 
Q, entonces a la suma de |Q] M(f, Q) para todos los subrectángulos de P la 
llamamos suma superior de Riemann S(f, P) de f respecto a la partición 
P, es decir 

S(f,P)= Y IQIM, Q 


QEP 


De manera análoga, definimos la suma inferior de Riemann de s(f, P) de 
f respecto a la partición P como 


P) = Y |Q|m 


QEP 


A =[a, b]x![c, d] 

P=P xP, 

Pr AA i, a 
P = (c, Y 1, Yar Ym- 1 d) 





FIGURA 2. Partición del rectángulo. 


Si |A| es el área del rectángulo A, M es al supremo de f en A y m su 
ínfimo, cualquiera que sea la partición P de A, es claro que se cumple la 
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siguiente desigualdad 
PETS PERE AN 


En otras palabras, los conjuntos de todas las sumas superiores y de todas las 
sumas inferiores de Riemann están acotados. Al ínfimo de las sumas supe- 
riores se le llama integral superior de Riemann y se denota por T TE 
y al supremo de todas las sumas inferiores de Riemann se le llama integral 
inferior de Riemann y se denota por jA f. Las integrales superior e infe- 
rior de Riemann existen siempre ya que todo subconjunto de números reales 
acotados poseen supremo e ínfimo. 


Definición de integral de Riemann de f en A. Decimos que f es 
integrable en A si sus integrales superior e inferior son iguales, es decir 


FER 


A este valor le llamamos integral de f en A y lo representamos por f To 
bien por f, f(x, y)dudy 


Las integrales de dos variables también se llaman integrales dobles y otra 
forma de representarlas es ff 4 f. La función f se denomina integrando, y 
el rectángulo A recinto de integración. Designamos por P el conjunto de 
todas las particiones de A. 


9.1. Ejemplos. 


1. De forma análoga al caso de una variable, veamos que una función 
constante f(x,y) = k es integrable en cualquier rectángulo A de R?. En 
efecto, cualquiera que sea la partición P € P de A, se tiene 


S(£,P)= Y 101M(£,Q) = 2 IQ] k = JAlk 


QEP QEP 
=D A Y e= Ak 
QEP QEP 


ya que m(f,Q) = M(f,Q) = k. Luego todas las sumas son constantes y las 
integrales superior e inferior valen |A| k. 
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2. Veamos que la función definida por f(x,y) =1 si x e y son racionales 
y f(x,y) = 0 si z o y son irracionales no es integrable en el rectángulo 
A = [1,2] x [3,5]. En efecto, cualquiera que sea la partición P, en cada 
subrectángulo Q de P existen puntos con las dos coordenadas racionales con 
lo que M(f,Q) = 1 y puntos con las coordenadas irracionales con lo que 
s(f, P) =0. Por lo tanto, como| A| = 2, se tiene 


f 1=014=> n f s=oxtai=o 


La caracterización de las funciones integrables de varias variables es la 
misma que la estudiada para una variable. La demostración de la condición 
de Riemann es idéntica a la dada en el Capítulo 7 sin más que sustituir el 
intervalo [a,b] por el rectángulo A. De igual forma, la longitud se cambia 
por el área para definir en el plano los conjuntos de medida nula y el teore- 
ma de Lebesgue se enuncia en estos términos. Esta última cuestión adquiere 
aquí una gran importancia porque nos permite extender los recintos de inte- 
gración a conjuntos acotados mucho más generales que los rectángulos. 


Condición de integrabilidad de Riemann. f es integrable en A si 
y sólo si para cada e > 0 existe una partición P de A tal que S(f, P) — 
FP 


Si D es un subconjunto de R? su medida es su área, entonces decimos que 
D tiene medida nula si su área es cero, o lo que es equivalente si fijado un 
número positivo arbitrariamente pequeño € > 0 existe una colección de bolas 
que incluyen a todos los puntos de D tales que la suma de sus áreas es menor 
que e. Es obvio que un número finito de puntos tiene medida cero, y de la 
misma forma que se prueba para el caso de una dimensión, sustituyendo la 
colección de intervalos por la de bolas, se prueba que un conjunto numerable 
de puntos del plano también tiene medida cero (se deja como ejercicio). 


Caracterización de las funciones integrables (teorema de Lebesgue). 
Sea f : A — R acotada. Una condición necesaria y suficiente para que exista 
r af es que el conjunto de puntos de A en los que f no es continua tenga 
medida nula. 


Entonces, como en el caso de una variable, toda función continua en A o 
bien discontinua en un número finito o numerable de puntos es integrable. 
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9.2. Ejemplos. 


a) Sea A =|[0,1] x [0,1]. La función definida por 


2 


e ga si z—y<0 
A Ss =y>0 


es integrable en A, pues f sólo es discontinua en el segmento de la recta 
y = x, diagonal del cuadrado, y el segmento tiene área cero. 


b) La función f(x, y) = z si z es racional, f(x,y) = 3 en los demás casos, 
no es integrable en el rectángulo A = [—1,0] x [1,2], ya que es discontinua 
en todo el rectángulo y el área de A es 1. 


2.1. Integración sobre un recinto acotado. 


Recordemos que un subconjunto M de R? es acotado si existe una bola y 
por tanto un rectángulo que lo contiene. A cada subconjunto M le asociamos 
una función xy de R? en R, llamada función característica de M, definida 
por 

J1 si(z,y)EM 
Xm(z, y) = l O si (x,y) € M 


La función característica nos permite extender el concepto de integral de 
una función sobre un rectángulo a la integral sobre un subconjunto acota- 
do. Supongamos M contenido en un rectángulo A y sea f una función real 
definida e integrable en A. 

Integración sobre un conjunto acotado. Se llama integral de f sobre 
M y se representa por f m f a la integral de la función producto f -Xm sobre 
A, siempre que esta integral exista. 


f t=] txu 


Supongamos que f es integrable en A. Como ym vale 1 en M y 0 en el 
resto del rectángulo A, su conjunto de puntos de discontinuidad es la frontera 
de M. Por consiguiente yw es integrable en A si y sólo si la frontera de M 
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tiene medida cero. Entonces, si xy es integrable en A también lo es f - Xm, 
ya que el producto de dos funciones integrables es una función integrable, y 
como consecuencia existe la integral de f en M. El conjunto M decimos que 
es el recinto de integración de f. 





FIGURA 3E Integración sobre un recinto acotado M. 


La frontera de la práctica totalidad de los subconjuntos M que utilicemos 
tendrá medida cero y serán recintos de integración. Entonces: 


Si Fr M tiene medida nula, una función es integrable en M si su conjunto 
de puntos de discontinuidad en M también tiene medida cero. 


Por ejemplo, si M está limitado por una curva diferenciable y f es conti- 
nua en M, entonces existe f m f. La integral también se suele representar por 


3. Integración reiterada. 


Sea f una función integrable en A = la, b] x |c, d] . Supongamos f definida 
en A y positiva, es decir f(x,y) > 0 para todo (x,y) € A. Consideremos el 
cilindroide limitado por la superficie z = f(x, y) y los planos paralelos a los 
planos coordenados que pasan por los lados de un rectángulo. En la introduc- 
ción comentamos que el concepto de integral doble lo motivaba el cálculo del 
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volumen del cilindroide. Una idea intuitiva para calcular ese volumen nos lle- 
varía a descomponer el cuerpo en bandas paralelas al plano yz, o al plano zz, 
tal como se demuestra en la figura. El volumen aproximado de cada banda 
sería el área de la cara por su anchura, esto es 


d 
V; = (£: z 2) f ME, y)dy 


La suma de los vólumenes de todas las bandas nos sugiere que el volumen 
total venga dado por la integral reiterada 


v= (f iena) de 


o bien, en caso de considerar bandas paralelas al plano xz, por la integral 


reiterada 
d b 
v=/ ( / f(o.9)da) dy 


con lo que ambas integrales deben de ser iguales. 





FIGURA 4E Integración reiterada. 


Al margen de las consideraciones intuitivas hechas, podemos preguntarnos 
en qué condiciones las integrales reiteradas existen, son iguales y coinciden 
con la integral doble. De esta manera dispondremos de un método para cal- 
cular integrales dobles a partir de integrales simples. En la notación siguiente 
prescindiremos de los paréntesis. 
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Integración reiterada. Sea f integrable en A = a,b] x [c,d]. Si para 
cada x de [a,b] y para cada y de lc, d] existen las integrales qe f(x, y)dy y 


f? fe, vaz, entonces se cumple 


J Fevdzdy = i ' ] Met ' J Teaia 


Demostración. Probaremos que la integral doble es igual a la primera in- 
tegral reiterada. De forma análoga se prueba que es igual a la segunda. Como 
consecuencia de ambos resultados se obtienen las igualdades del enunciado. 


Sea P = P, x P, una partición de A, en donde 
= {a = Lo, Li, 3 Ti; +. En = b} y Po = fc = Yo, Yı, e Yq; e33 Ym = d} 
y sean las funciones 
d Ya 
= / Fx,y)dy y gt) = f f(z, y)dy 
Cc Yq—ı 


Supongamos que M,¿ y Mrg con el supremo y el ínfimo de f en el subrectángu- 
lo Qr = [rra] x year como a A f(x, y)dy y por tanto 
mayor que Mrq( Ya — Ya-1) y menor que MralYq — 0] A se tiene 


Tira Ua A Y UE) 


para cada x € [2,_,, £r], y por tanto 


> Malia e Yg-1) 2 g(x) = Y gl) = y Mea ss Yaa) 
q=1 q=1 q=1 


Para cada r fijemos un punto x;. del intervalo [z,_,, tr]. Si multiplicamos la 
desigualdad anterior por (1, — Ty) y sumamos respecto de r, resulta 


n 


Yo — Tr-1) De MralYa — Ya-1) E a ia 


< Je (i — Tri) E MralYg — Ya-1) 


all q=1 
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lo que es equivalente a 
SAP) < Yo += ara(a!) < S(f, P) 
ya que 
e Ela = Lr-1)(Yg — Ya-1) 
)= Y Mala — tr-1)(Ya — Yg-1) 


Como f es integrable en A, de las desigualdades de las sumas se deduce 
que g es integrable en la, b] , pues el supremo de s(f, P) y el ínfimo de S(f, P) 
cuando P recorre las particiones de A son por definición la integral de f en 
A. Entonces, la desigualdad implica que 


b 
i fa, y)dedy < J aíajdr < / fx, y)dedy 


y teniendo en cuenta que 


f soa = j dx [sema 
J ste.wary = pa 


que es lo que quríamos demostrar. 


resulta 


Si f es integrable en el recinto M limitado por dos curvas y = h(x) e 
y = ha(x) definidas en el intervalo [a,b] tales que hı(x) < ha(x) para todo 
x € [a,b], entonces 


ho(x) 
he ay ucdy= la dx | 
hı(z) 
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y de igual forma si M está limitado por dos curvas z = h1(y) y x = ha(y) 
definidas en el intervalo [c,d] tales que h1(y) < ha(y) para todo y € [c,d], 


entonces 
af 
/ f(z, y)drdy = m dy f Jac adz 
h1(y) 


9.3. Ejemplos. 


a) Sea M = [(x,y) ER? : (y—4)/2>x > —y1— y; y € [0,4]). Como 
M está limitado por las curvas x = — y4 — y y x = (y — 4)/2 definidas en el 
intervalo [0, 4], (represéntese 11), resulta 


(y "+ 
f f(z, y ldady= i wj dx 


El recinto M también lo podemos considerar limitado por las curvas y = 4-2? 
e y = 21 + 4 definidas en el intervalo [—2, 0], con lo que también resulta 


/ Fo. ui = f dx e 
2144 


b) Calculemos la integral de f(x, y) = xy sobre el recinto M limitado por 


la recta y = x y la parábola y = 2?. 


ee ses [vto [(E-E) ás 


6 
sa a NE: PAN 
-3 [0 ka JF a] 24 


4. Cambio de variable. 


Sean A y B dos subconjuntos de R”. Un cambio de variable en A es una 
función biyectiva de A sobre B = g(A). Su función inversa g`? de B en 


La integral múltiple 281 


A=g*(B) es a su vez un cambio de variable en B. Si g es de clase q en A, 
se dice que g es un cambio de variable de clase q en A. 


El siguiente resultado, conocido con el nombre de teorema de la función 
inversa, proporciona una condición suficiente para asegurar la existencia de 
un cambio de variable diferenciable en el entorno de un punto. Supongamos 
que A es un subconjunto abierto de R”. 


Teorema de la función inversa. Sea g : A —> R” de clase q > 1 en 
el entorno V C A de un punto a € A y detg'(a) Æ 0, entonces existe un 
entorno W de b = g(a) tal que g: V > W es biyectiva, g7! es de clase q en 
W y para cada y € W se verifica que g7" (y) = CAC DIS 


Obsérvese que el caracter del teorema de la función inversa es local ya 
que se refiere a un entorno del punto y no a todo el dominio 4. Sin embargo, 
si g es biyectiva y cumple las condiciones del teorema para cada punto x 
de A, entonces g es un cambio de variable de clase q en A. Recuérdese que 
la derivada g”*(y) de g”*(y) ya la habíamos determinado en el capítulo 
anterior. 


Desde un punto de vista geométrico podemos considerar a g = (91, 92, ..., Jn) 
como una transformación. Si g transforma el conjunto A en el conjunto B y 
(u1, uz, .., Un) E A, lo podemos denotar mediante las ecuaciones. 


zı = gı (u, U2, ..) la T2 = g2(u1, U2, 095) tia), Tn = gnl, U2, 395) Un) 


en donde (£1, £2, .., £n) € B, a las que llamamos ecuaciones del cambio 
de variable. A det g'(a), jacobiano de g en a también se le denota por 
J(a). Estudiemos alguno de los cambios de variable más utilizados en los 
problemas. 


Coordenadas polares. Cada punto P del plano lo podemos representar 
por el par (p, 0) en donde p es la distancia de P al origen y 0 es el ángulo 
que forma con el semieje positivo Ox* la recta que pasa por el origen y el 
punto. Al par (p,0) se le llama coordenadas polares de P. Véase la figura. 


Sea la aplicación la g : R? — R? definida por las ecuaciones 
z =pcosó, y = psen 0 


Evidentemente g es de clase infinito en R? y su jacobiano 
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, Mi ACOSO EEC 

A send  pcosg | 

es distinto de cero si p 4 0. Como g(p, 0) = g(p,0+2kr), es claro que g no es 
inyectiva y por tanto no puede ser un cambio de variable en todo R?. Ahora 
bien, si para un valor fijo de 6, por ejemplo ĝo = 0, consideramos el conjunto 
abierto 


A=((p,0) ER*:p>0,0<08<2r) 


la restricción de g al conjunto A es inyectiva, por tanto un cambio de variable 
de clase infinito entre A y g(A). Obsérvese que g(A) es todo R? menos el eje 
positivo Oz. 

Resolviendo las ecuaciones dadas se obtiene el cambio inverso g”* de g(A) 
en A. Si (x,y) € g(A), su posición en cada uno de los cuadrantes del plano 
determina el valor del ángulo 0, y las ecuaciones de g”*en este caso son 


arctagÍ siz>0ey 20 


2r +arctag sim >0ey>0 


p=yx?+y?, 0= m + arctag six < 0 
7 sis=0ey>0 
3T 


3 siz=0ey<0 


Una importante aplicación del cambio a coordenadas polares es el cálculo 
de límites dobles. 


Aplicación del cambio a polares en el cálculo de límites. Sea B 
un subconjunto de R°, (0,0) un punto de acumulación de B y f(x,y) una 
función de B en R. Si efectuamos el cambio a polares z = pcos, y = psen y 
designamos por F(p,0) = f(pcos0, psen 0) la función resultante, se cumple: 


La condición necesaria y suficiente para lím  f(x,y)=1l es que 
(z,y)— (0,0) 


lím F(p,0) =1 
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uniformemente en 0. 


El significado de esta convergencia uniforme en 0 es que para todo £ > 0 
exista ô > 0 tal que siempre que O < p < ô, se verifique |F(p,0) — 1| < € 
cualquiera que sea 0 € [0,27]. En otras palabras, cualquiera que sea el ángulo 
0 del punto de la bola B((0, 0), ô) se cumpla que su imagen esté en el entorno 
de l, es decir en el intervalo (l —e,l + e). 


En el caso particular en que F(p,0) = h(p)g(0), si g(0) está acotada por 
k y lím h(p) = 0, como 
p> 





0 <|F(0,0)| < |h(p)1 19(0)1 < Ih(o)1k 
es claro que lím F(p,0) =0. 
p—>0 
9.4. Ejemplo. 
La función 
z? — y? 
——_—=5 . 0,0 
fay)=4 Hy > y) 7! 
0 y) (070 
f es continua en (0, 0) ya que 
ai — y’ p? cos? O — p* sen $0 
lí = lí — >= lí a ISS 
(000) Hoy) (000) T? y 70 p 


— y ae. T 
= lím p (cos*6 sen 0) 0 


Nótese que cos 0 — sen 0 está acotada por 2. 


Coordenadas cilíndricas. Las coordenadas polares del plano se extien- 
den al espacio de tres dimensiones sin más que considerar igual la tercera 
coordenada. Es decir, las coordenadas cilíndricas de un punto P vienen dadas 
por la terna (p,0,z). Véase la figura. 

Si A es el abierto del plano asociado al cambio en coordenadas polares, 
entonces las ecuaciones del cambio de variable g definido en el abierto A x R 
son 

x = POSÓ. u= psend, 2=2 
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en donde (p,0,z) € AXR y (x, y, z) € J(AXR), y las dos primeras ecuaciones 
del cambio inverso g”* son las del cambio a polares y la tercera es z = z. Es 
obvio que se trata de un cambio de variable de clase infinito y su jacobiano 


cosó —pseng 0 
detg'(p,0,z) =| senf pcosó 0 |=p 
0 0 Il 





P 
J 
a 
x 
Coordenadas polares Coordenadas cilíndricas Coordenadas esféricas 


FIGURA 5. 


Coordenadas esféricas. Cada punto P del espacio R? lo podemos re- 
presentar por la terna (p, 9, y) en donde p es la distancia de P al origen, 0 el 
ángulo que forma en el plano xy la proyección de OP y el semieje positivo 
Ox*, y y el ángulo que forma OP con el semieje Oz*. A (p, 0, p) se le llama 
coordenadas esféricas de P. Véase la figura. 


Si consideramos el abierto A de R? 


A=|((p,0,p) ER*:p>0,0<0<2r, 0O<p<m) 


podemos definir un cambio de variable g de clase infinito en A mediante las 
ecuaciones 


x= pcos sen y, y = psenÚGsen y, z = pcos y 
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cuyo jacobiano es 


cosósenp —psenOsenp pcosð0 cosy 
detg'(p,0,z) =| senĝseny pcosOsenp psen cosy | = —p sen p 
COS p 0 —p sen Y 


En las ecuaciones del cambio inverso el valor de los ángulos 0 y y depen- 
den obviamente del octante en el que se encuentre el punto (x,y,z). Las 
correspondientes al primer octante son: 


p=VRFY+2, 0= arctago, p = are cos —=—=— 
T U a n 


Nota. Si en las coordenadas anteriores se consideran otras referencias. 
es decir otros ángulos, obtenemos coordenadas y cambios análogos. En otras 
palabras, los sistemas de coordenadas estudiados, son los que se utilizan ha- 
bitualmente y obviamente no son únicos aunque les demos el mismo nombre. 


9.5. Ejemplos. 


a) Sea g : R? — R? definida por g(x,y) = (xy, x + y). Estudiemos en que 
condiciones es g un cambio de variable. En primer lugar g es de clase infinito 
en R?, además su jacobiano J(x, y) 


y 


det g(x,y) =| 3 > =Yy-2 








es distinto de cero para todo (x,y) tal que z — y # 0. Por tanto para ca- 
da punto de R? que no pertenezca a la recta y = x existe un entorno en 
el que g posee función inversa y por consiguiente g es un cambio de varia- 
ble. Analicemos cuáles son los mayores subconjuntos abiertos (en el sentido 
del contenido) en los que g es biyectiva. Desde luego estos subconjuntos no 
pueden contener a la recta y = x y tienen que estar contenidos en uno de los 
semiplanos y > x o bien y < z. 


(io y, HU) => 21 = UU a S 
Ss ls 1 Sr le 4) =uly' Y) 50 
> (y —y)le' =y)=0 
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Si x' Æ y, entonces y' = y y sustituyendo en la ecuación zt +y = x +y 
se tiene x’ = x. Por tanto la condición para que sea biyectiva es z’ Æ y. 
Determinemos en que subconjuntos se cumple. Si y = z’, de las ecuaciones se 
obtiene z = y”, con lo cual los puntos (x,y) y (x', y”) = (y, £) serían simétricos 
respecto a la recta y = x. Como consecuencia g es un cambio en cada uno de 
los semiplanos y > x o y < x. Resolviendo las ecuaciones u = zy y v = £ +y, 
se obtienen las del cambio inverso. 


4.1. Cambio de variable en la integral. 


El cálculo de integrales dobles puede facilitarse mediante cambios de va- 
riable apropiados que simplifiquen los recintos y las funciones. Sea g un cam- 
bio de variables de ecuaciones x = gı (u, v), y = g2(u, v) definido en un recinto 
T, y sea f una función integrable en el recinto M = g(T). Entonces: 


La integral doble de f sobre M es igual a la integral sobre T de fog 
multiplicada por el valor absoluto del jacobiano det g'(u,v) de g, es decir 


i F eE Jf f(gı(u, v), galu, v)) |det g'(u, v)| dudu 


El teorema anterior se conoce con el nombre de Teorema del cambio 
de variable en la integral doble y su demostración puede verse en Am- 
pliación de cálculo, capítulo 13, editorial Uned. Obsérvese que |det g'(u, v)| 
desempeña el papel análogo a g'(t) en el cambio de variable z = g(t) para la 
integral simple. Otra cuestión que debemos de tener en cuenta es la validez 
del resultado aunque el jacobiano se anule en un subconjunto de área cero 
del recinto. 


9.6. Ejemplos. 


a) Mediante el cambio a coordenadas polares x = pcosÓ, y = psenó, 
determinemos el valor de la integral 


E= Ja + y?) dxdy 
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en donde M = { (x,y) ER? : 1? +4? <1}. 
El recinto M se transforma en T =((p,0) €R*:0<p<1,0<0<2m). 
Teniendo en cuenta que el jacobiano es p, resulta 


27 1 27 2 p=1 
-f Uee- [za 
o 0 o 4 p=0 


b) Sea T el triángulo del plano uvde vértices (0,0), (2,0) y (0,2) y el 
cambio de variable de ecuaciones x = u + v, y = v — u?, cuyo jacobiano es 


J(u,v) = 1 + 2u. Si M = g(T), calculemos por separado cada una de las 


integrales 
f dxdy = $ |J(u, v)| dudu 
M T 


para probar la igualdad anterior 
Como 


w| a 


T=([(u,v)ER*:0<u<2,0<v<2-u) 


g transforma la recta u = 0 en la recta y = x, la recta v = 0 en la parábola 
y = —2? y la recta v = 2 — u en la recta x = 2, entonces 


== E y RO, -x° <y <r} 


con lo cual 


i dxzdy = fef w= f erT) Ti 
M m2 En 


ffar ziua f (1+ 2u)du f ‘wf Dolik 


5. Integral múltiple. 


El concepto de integral doble y todos sus resultados se extienden sin 
ninguna dificultad a cualquier número n de variables. En el caso n = 3 la 
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integral se llama triple, en el caso n = 4 la integral se llama cuádruple, 
etc. Por ejemplo si f es una función definida y acotada en el rectángulo 
tridimensional (paralelepípedo) 


A = [a,b] x [c,d] x [e, 9] 


y consideramos una partición en cada uno de los intervalos que definen 4, 
obtenemos una partición P = P, x P> x P; de A que determina una colección 
de subrectángulos Q. Para cada partición P podemos definir la suma superior 
S(f, P) y la suma inferior s(f, P) y establecer el concepto de integral triple 
por repetición exacta del proceso desarrollado en las integrales simple y doble. 


Análogamente al caso n = 2, f es integrable en A si y sólo si el conjunto 
de puntos de discontinuidad de f en A tiene volumen n—dimensional cero. 
La integración de f sobre un recinto acotado M, contenido en A, se define 
igualmente a partir de la función característica de M. Para n = 3 se tiene 


J f(x,y, 2)dxdydz = i XM (L y, 2) f(x, y, 2)dxdydz 
M A 


y la existencia de la segunda integral está asegurada si f es integrable en A 
y la frontera del recinto M tiene volumen cero. 


Si se cumplen condiciones análogas a las establecidas para n = 2, la 
integral múltiple, y en particular la integral triple, puede calcularse por in- 
tegración reiterada 


b y2(z) z2(x,y) 
| Neviaaniyiz=af raz | Cay] flayed 
M a yı(z) zı(z,y) 


en donde z = 21(1,y) y z = z2(x, y) son dos superficies que limitan el recinto 
M, cuya proyección sobre el plano xy es un recinto limitado por las curvas 
y = yı(x) e y = ya(x) definidas en el intervalo [a,b], es decir, 


A o ES O) OS 0 


Véase la figura. 
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yi=iy,inv) 


FIGURA 6E Recinto proyectable respecto al plano xyE 
T 


Esta clase de recintos se llaman recintos proyectables sobre el plano 
xy. De igual forma podemos considerar recintos proyectables respecto a los 
planos xz e yz, y obtener expresiones similares a la anterior. 


El cambio de variable en la integral múltiple, y en particular en la integral 


triple, tiene la misma expresión que en la integral doble y se cumple bajo las 
mismas hipótesis. Si 


T= gi(u, Y, w), y= go(u, U, w), z= g3(u, V, w) 
son las ecuaciones de un cambio de variable g(u, v, w) de clase uno que trans- 


forma el recinto T en el recinto M, esto es M = g(T), y J(u,v,w) es el 
jacobiano de g en (u,v, w), se tiene 


Tau dedy = / f(g((u, v, w)) |J(u, v, w)| dududw 
M a 


9.7. Ejemplos. 
a) Determinemos el valor de 7 = fff vyzdxdydz, en donde 


M=((0,y,2)ER*:2>0,y420,2>0,0+y+2%<1) 
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Aplicando integración reiterada 


1 vVl=x2 y 1-22—y? 
.. l, 
0 


0 0 


b) Calculemos mediante el cambio a coordenadas cilíndricas la integral 


= n 4h dxdydz 
M 


M=(¿f(1,y 2) ER :12>0,y>0,0<2<2, (1-1)P+y?<1) 


en donde 


El recinto M es un cilindro cuya base en el plano zy y está limitada por la 
circunferencia (1—1)?+ y? = 1. Para determinar su ecuación en coordenadas 
polares sustituímos x = pcos, y = psen y resulta 


(pcos8 — 1} + p*sen*0 = 1 > p=2c0s8 
Por tanto el recinto T' es 
T=|((p,0,2)€R*:0<0<x/2, 0£p<2c050, 0<2<2) 


Teniendo en cuenta que el jacobiano es J(p,0,z) = p, la integral resulta 


7/2 2cos 0 2 4 
a ao | pap | ama f de 0 
0 0 0 
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5.1. Recintos proyectables. 


En el estudio de la integración reiterada hemos hecho mención de los 
recintos proyectables. Esta clase de recintos aparece en la mayoría de los 
problemas que se presentan en la práctica. Analicémoslos con un poco más 
de detalle. 


Recintos proyectables planos. Un recinto M decimos que es proyectable 
respecto al eje Ox (al eje Oy) si las rectas paralelas al eje Oy (al eje Ox) 
cortan a su frontera como máximo en dos puntos, excepto en las partes de 
la frontera formadas por segmentos paralelos al eje Oy (al eje Ox). Véase la 
figura. 





Recinto proyectable Recinto proyectable 
sobre el eje Ox sobre el eje Oy 





Recinto no proyectable Recinto proyectable 
sobre ningún eje sobre los dos ejes 


FIGURA 7. 


Los recintos limitados por dos curvas y = y¡(1) e y = ya(x) tales que 
y, (1) < ya(x), definidas en el intervalo [a,b], y las rectas z = a e z = b 
son proyectables sobre el eje Ox. De forma análoga los recintos limitados 
por las curvas z = z(y) e z = za(y) tales que zı(y) < xa(y), definidas en el 
intervalo [c, d] , y las rectas y = c e y = d son proyectables sobre el eje Oy. En 
general los recintos no son proyectables, pero en una buena parte se pueden 
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descomponer como unión de un número finito de recintos proyectables. La 


integral sobre M es la suma de las integrales sobre los subrecintos en que se 
ha dividido M. Véase la figura. 





y 
0 
x 
M=M, UM, M=M,UM, 
M, proyectable sobre Ox M, y M, proyectable sobre Ox 


M, proyectable sobre 0y 
FIGURA 8. 


El caso de los recintos del espacio es similar al caso de los recintos planos. 
La proyección se considera sobre uno cualquiera de los tres planos. 


Recintos proyectables en el espacio. Un recinto M de RÌ decimos que 
es proyectable respecto a un plano coordenado si las rectas perpendiculares al 
plano cortan a la frontera de M como máximo en dos puntos, salvo que Fr M 
contenga segmentos rectilíneos perpendiculares al plano. Véase la figura. 


AN 











— 
y 
ES Espacio comprendido entre dos 
esferas concéntricas 
Recinto proyectable sobre xz Recinto no proyectable 
no proyectable sobre xy sobre ningún plano 


FIGURA 9. 
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Si un recinto M es proyectable respecto a un plano coordenado, entonces 
su proyección sobre él es un recinto proyectable plano. Los recintos limitados 
por dos superficies (por ejemplo z = 2,(1,y) y z = 22(7, y)) definidas en el 
mismo subconjunto M’ del plano de las variables (plano xy) es proyectable en 
dicho plano (su proyección es M”). En la mayoría de los casos los recintos no 
son proyectables respecto a ninguno de los planos coordenados, pero pueden 
descomponerse en un número finito de subrecintos proyectables. La integral 
sobre M es la suma de las integrales sobre los subrecintos en los que se ha 
dividido. Véase la figura anterior. 


9.8. Ejemplo. 


El recinto M = {(xz,y) E R? : y > 2, zy > 2, 2y — x < 3) es proyectable 
respecto a los dos ejes (véase la figura). 





FIGURA 10. Recinto M = M) U M3. 


Si f es una función definida en M, podemos determinar f m f(z, y)dzdy 
por las integrales reiteradas respecto a su proyeccion sobre el eje Ox 
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V2 (2+3)/2 3 (z+3)/2 
J da | fenau | dz | f(x, y)dy 
1 2/7 V2 T 


o por su proyección respecto al eje Oy. 


2 y 3 y 
f dy A a Aa f dy f AE 
Ya Jay 2 2y-3 


En el primer caso decimos que el orden de integración es (dx, dy ty en el 
segundo (dy, dx). Obsérvese que en la figura se señalan los subrecintos M, 
y Mə para la integración (dy, dx), aunque en ambos casos se ha tenido que 
dividir M en dos subrecintos. 


6. Aplicaciones de la integral. 


El Cálculo integral tiene numerosas aplicaciones en diferentes partes de 
las distintas ramas de la ciencia y la tecnología. Constituye una herramienta 
básica en la resolución de infinidad de problemas. A continuación vamos a es- 
tudiar alguna de sus aplicaciones al cálculo de longitudes, áreas y volúmenes. 


Área de un recinto plano. El área S de un recinto plano M viene 
determinada por S = f f m Ázxdy, siempre que dicha integral exista. 


La definición es consecuencia inmediata del concepto de integral doble. 
Si el recinto es proyectable sobre el eje Ox y viene limitado por las curvas 
y = yı (x) e y = ya(x), tales que y, (1) < y2(x) y están definidas en el intervalo 
la, b] , entonces 


b 
S= | (uo) —w(0))4o 
que en el caso particular en que y, (1) = 0 se convierte en S = de ya(2)dx. 
9.9. Ejemplo. 


Calculemos el área de la región del plano limitada por la hipérbola zy = 1 
y las rectas y = x e y = 4x, es decir el área de : 


M=4(09) ER %10>0, y>0,0<y<4r, xy <d) 
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Los puntos de intersección de las rectas con la hipérbola son (1,1) y (1/2, 2). 
El recinto M lo podemos considerar como la unión de los recintos 


Mps (o Dial /2, mE y da) 
MEA Vaa T aeS Ta 


y el área de M es la suma de las áreas de Mı y Mə. Entonces 


0 dady= || dudy + || drdy = 
M Mi M2 
1/2 4x 1 1/x 271/2 271 
3 dz | d+] do | a= (7 + [ino-5| =12 
0 z 1/2 z 2 Jo 2 11/2 





FIGURA 11. Recinto M =M, U M,. 


Volumen de un cuerpo. El volumen V de un recinto M de un espacio 
tridimensional viene dado por 


J|] izdva: 
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siempre que exista la integral. 

Sea M un recinto proyectable sobre el plano xy, limitado por dos super- 
ficies z = 21(12,y) y 2 = 22(1, y) definidas en el recinto M’ proyección de 
M sobre el plano xy, tales que 2,(1,y) < za(x, y). Supongamos que M' esta 


limitado por las curvas y = y¡(x) e y = ya(1) de modo que y, (1) < ya(x) y 
están definidas en el intervalo [a,b]. El volumen de M viene dado por 


ya(x) 
v=- amfa (z2(£,y) — z (x, y))dy 
yı(z) 


En el caso particular de ser z1(x,y) = 0 y za(x,y) > 0, es decir, de estar 
limitado por el plano xy y una superficie positiva, resulta 


ya(x) 
v= [an fo 
y1(x) 
y recobramos la expresión de la integral doble. 


De la misma manera podemos obtener fórmulas análogas para recintos 
proyectables sobre los otros planos coordenados. 


9.10. Ejemplo. 


Calculemos mediante una integral el volumen de la esfera. Determinemos 
el volumen V de la octava parte, es decir el volumen del recinto 


M= Du SR a 0 0, r? +y +2? <r’) 


entonces 


r vr? y/r2=1?=y? r vr 
vo] do | dy | az= | dx Y AO o 
0 0 0 0 0 


Efectuando el cambio a coordenadas esféricas 


x = pcos sen y, y = psen sen p, z = pcos y 


el recinto M se transforma en 
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DARRO, 2] MP L pe, Upa on 


y teniendo en cuenta que |.J(p, 0, z)| = p? sen p, resulta 


7/2 r T/2 1 
V= JII p° sen pd0dpdy z a | pdo | sen ydy = -rr’ 
R 0 0 0 6 


con lo cual el volumen de la esfera es 8V = fnr’. 

Longitud de un arco de curva. Una curva Č en R” es una aplicación 
continua de un intervalo |a, b] en R”. Consideremos una curva C determinada 
por una función (x(t), y(t), z(t)) definida y derivable en el intervalo [a,b]. 
Cada partición P = {a = to, tı, ..., tn = b} define una línea poligonal, de n 
lados, inscrita en Č. Si para cada número natural n, suponemos una partición 
arbitraria P, de modo que la máxima longitud de cuerda tienda a cero, 
entonces las longitudes de las líneas poligonales, L1, La, ..., Ln, ...tienden a la 
longitud de la curva C. 


E RRA 
di=itolit; t £,¿=ib 





Línea poligonal inscrita en € 


FIGURA 12. 


Representamos por AS; la longitud de cada trozo de curva que determina 
la partición, como AS lo podemos aproximar por la longitud de la cuerda, la 
cual por el teorema de Pítagoras es y Ax? + Ay? + A27, en donde Az;, Ayi, 
Az, son las longitudes |z(t;) — x(t;-1)1, ly(t;) — y(ti-1)1, [2 (t:); — 2(t;-1)|, en- 
tonces podemos definir la longitud de la curva por 


ye / TO FO OA 
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La demostración puede verse, por ejemplo, en Calculus, T Apostol, editorial 
Reverté [7]. 


9.10. Ejemplo. 
La longitud del arco de curva 
z= i y nn de 


entre los puntos P = (1,0,1) y Q = (—e”,0,e”), como P es la imagen de 
t=0 y Q es la imagen de t = 7, y 


T'(t) = é (cost — sent), y (t) = e (sent + cost), z(t) = é 
resulta 


1/2 


D= / |e” (cost — sen t)? + e”(sent + cost)? + e”] dt = 
0 


= [Vie =13 1 
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Ejercicios y cuestiones propuestos 


1. Sea A = [0,2] x [1,4] y f(x,y) = xz + y. Resuélvanse las siguiente 
cuestiones: 


a) Encontrar una partición P, de A que determine n* subrectángulos con 
la misma área. 


b) Calcular s(f, P,) y lím s(f, Pa). 
Nn—>00 
c) Calcular S(f, Pa) y lim S(f, Pa). 


d) Calcular por integración reiterada f, f(x, y)dzdy y comprobar que es 
igual a los límites de a) y b). 


2. Sea A = [0,2] x [1,4] y f : A — R definida por f(x, y) = (x + y)? si 
<y<2x y f(x, y) =0 en el resto. 

a) Razónese la existencia de la integral. 

b) Dibújese el subconjunto de A en el que la integral de f es cero. 

c) Calcúlese f, f(x, y)dxdy. 


3. La integral doble de una función es igual a la integral reiterada 


il i dx ] a f(x, y)dy 


Determínese el recinto e inviértase el orden de integración. 


4. Calcúlese la integral de f(x,y) = x — y sobre el recinto 


M=((2,y) €R?: le] <1, ly] <1) 


5. El volumen de un recinto M limitado superiormente por la superficie 
z = f(x, y) e inferiormente por el plano z = 0, viene dado por 


Il d f” tenius [Cas f” fenas 


a) Determínese M e inviértase el orden de integración. 
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b) Calcúlese V si f(x,y) = xy. 


6. Calcúlese mediante una integral doble el volumen de la pirámide trian- 
gular de vértices (1,0,0), (0,0,0), (0,2,0) y (0,0,3). 


7. Calcúlese el volumen limitado por dos esferas concéntricas de radios a 
yb 0<a<b. 


8. Calcúlese la integral de f(x,y) = 1*%y sobre el recinto limitado por la 
parte positiva de los ejes, la circunferencia z?+y? = 1 y la elipse 1?+4y? = 4. 


9. Calcúlense en la corona circular 1 < z? + y? < 4, las integrales de 
a) f(x, y) = °y 


b) Hr, y) = V2? +y’ 
10. Calcúlese ff y(x — y)dxdy en donde 
Mada == =4%. 


11. Calcúlese mediante el cambio a coordenadas esféricas la integral 


mM / i (1? + y?) drdydz 


en donde M es el recinto limitado por la esfera z? + y? + 2? = r°. 


12. Determínese el volumen comprendido entre x > 0, y > 0, el paraboloide 
z = xy y los planos r =1ey=2. 


13. Dada la integral 


4 V16=x2 V2 4 
E ds | d+ f dz | f(x, y)dy 
0 0 1 (2?+y?)/4 


expresar I mediante integrales reiteradas en el orden (dz, dx, dy) y (dy, dz, dz}. 


14. Calcúlese el volumen limitado por las superficies 
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15. Calcúlese la longitud del arco de curva de la hélice circular  = a cost, 
y = asen t, z = ct determinado por los puntos (a, 0,0) y (a, 0, 27c). 


16. Sea la superficie z = z? — yt. Calcúlese la longitud del arco de curva 
que sobre la superficie determina z = t?, y =tdesdet=0at=1. 

17. Determínese la integral triple de f(x,y,z) = [1? + y? + (2 — DS 
sobre la esfera de centro el origen y radio 1. 


18. Calcúlese el área limitada por la curva z = a cos? t, y = a sen ĉt. 


19. Determínese À para que el volumen del paraboloide z = 12?+y? situado 
debajo del plano z = z + À sea 7/2. 


20. Demuéstrese que la longitud L, desde el origen al punto (x,y,z), de 
la curva z = 2a*t, y = 3abt?, z = 3b*t? cumple la relación L = g + z. 


21. Aplicación del cambio de coordenadas polares al cálculo de límites. 
Estúdiense los límites en (0,0) de las siguientes funciones: 


1 , 
a) AE ET si F00) =0. 





r 
c) f(x,y) = PR si f(0,0)=0. 
2 
d) f(x,y) = E si yo 4 a 
We Pe 


Capítulo 10 
Introducción al cálculo 
numérico 


1. Introducción y objetivos. 


Desde la antigüedad y hasta tiempos relativamente recientes los proble- 
mas concretos que se presentaban en los diferentes campos de la actividad 
humana, problemas mercantiles, geométricos, físicos, astronómicos, etc, eran 
fundamentalmente numéricos y conllevaban una gran cantidad de cálculos. 
Ya hemos comentado como los matemáticos griegos utilizaron el método de 
exhaución para determinar el área de figuras geométricas mediante aproxi- 
maciones por las áreas limitadas por polígonos inscritos. 


La aparición del álgebra en el siglo XVI impulsó el desarrollo de todas 
las ramas de las matemáticas y también de los métodos numéricos. Con el 
progreso del cálculo infinitesimal se introduce una atención especial por los 
problemas continuos y el razonamiento lógico, en el que se basan las técni- 
cas para demostrar verdades matemáticas. Sin embargo, y a pesar de esta 
concentración de esfuerzo por la construcción del nuevo edificio matemático, 
no se abandonan los procedimientos numéricos. En las primeras décadas del 
siglo XVII, Neper confeccionó su tabla de logaritmos, pero sin duda alguna 
es el estudio de la convergencia de las series numéricas el punto de partida 
del desarrollo del actual Cálculo numérico. 
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En un gran número de situaciones nos encontramos con problemas cuya 
solución exacta no podemos calcular o no es necesrio calcular porque única- 
mente necesitamos una “solución aceptable” del problema real en que traba- 
jamos. El propósito de este capítulo es introducir al lector en la búsqueda de 
soluciones aproximadas. 


En algunas ocasiones las funciones vienen determinadas mediante expre- 
siones muy complejas, cuyo estudio puede ser muy pesado y laborioso, o 
incluso mediante funciones sencillas y conocidas como el seno de un ángulo, 
pero que son difíciles de evaluar en casi todos los puntos. En otras ocasiones 
desconocemos la función que rige un fenómeno físico y sólo poseemos un con- 
junto de datos obtenidos a partir de la observación empírica. Normalmente 
acudimos a las calculadoras, a los ordenadores o a tablas ya confeccionadas 
para que nos proporcionen un valor aproximado al que buscamos o para 
definir una función que pueda sustituir con cierto éxito a la desconocida. En 
cualquiera de estas situaciones, además de los datos iniciales, necesitamos 
conocer los métodos que permitan establecer los resultados. El estudio de 
éstos métodos constituye el Cálculo numérico. 


1.1. Algoritmos. 


Entre todas las tareas, el cálculo numérico fue la principal causa que im- 
pulsó la creación de artilugios mecánicos. La historia de la creación de estas 
máquinas ha sido una manifestación del ingenio humano. Comenzó hace va- 
rios siglos y constituyó la base para la invención de los ordenadores actuales. 
La aparición de los logaritmos provoca una auténtica revolución: los pro- 
ductos y divisiones se pueden convertir en sumas y restas. El propio Neper 
inventó un artificio de rodillos para efectuar multiplicaciones. 


Un modelo matemático es una representación abstracta y simplificada 
de un fenómeno real. El hecho de que una buena parte de los fenómenos 
se rijan por leyes de carácter cuantitativo nos obliga a efectuar cálculos, a 
veces muy complicados, para resolver los problemas que plantean Como ya 
hemos comentado, la mayor parte de estos problemas necesitan una respuesta 
numérica, exacta O aproximada, por lo que una parte notable del esfuerzo 
investigador de las últimas décadas se ha centrado en el desarrollo de los 
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métodos y su tratamiento por medio del ordenador. Ésto ha dado lugar a las 
no muy acertadamente llamadas matemáticas de la computación. De ellas se 
considera parte esencial la creación de algoritmos y su “implementación” en 
el ordenador. 


Un algoritmo es un conjunto ordenado y finito de operaciones que per- 
mite resolver un determinado problema. A partir de unos datos iniciales de- 
nominados entrada y mediante la aplicación de un conjunto finito de reglas, 
se obtienen unos valores denominados salida, solución del problema prop- 
uesto. El propio concepto de algoritmo indica las condiciones que debe de 
cumplir: 


a) Finitud: el proceso tiene que acabar tras un número finito de 
pasos. 


b) Definibilidad: las acciones realizadas en cada paso tienen que 
estar especificadas sin nigún tipo de ambigúedad. 


c) Efectividad: el resultado tiene que ser la solución del problema 
inicial y obtenerse mediante las operaciones más elementales en el menor 
tiempo posible. 


Teniendo en cuenta esta última condición, el hecho de que un mismo pro- 
blema pueda ser resuelto por diferentes algoritmos, muestra la conveniencia 
de elegir el más apropiado. Desde un punto de vista computacional, son cri- 
terios de efectividad su sencillez, su adaptabilidad al ordenador, su tiempo 
de realización, etc. El análisis y las medidas de estas características han da- 
do lugar a una ciencia llamada Complejidad computacional, cuyo objeto 
podíamos sintetizarlo como el estudio del comportamiento de los algoritmos 
respecto de los recursos. 


1.2. Errores. 


Al aplicar el método numérico se pueden cometer errores que, obvia- 
mente, repercuten en el resultado final obtenido. Consideremos el estudio de 
un fenómeno real para el que deseamos crear un modelo matemático que lo 
represente. El primer error puede proceder de que el propio modelo imagi- 
nado no sea el adecuado o bien que su formulación no sea la correcta. En 


306 Capítulo 10 


segundo lugar, puede suceder que cometamos errores a la hora de realizar 
un experimento u observar en un cierto periodo una parte del fenómeno, o 
bien porque no sea correcta la ejecución del primero o bien porque no sea 
representativo y no se ajuste al proceso general el segundo. Al contrastar el 
modelo con la realidad su inadecuación nos hará rechazarlo. 


Otra clase de errores son debidos a la propia incertidumbre de los datos y a 
nuestro sistema de medida. Estos errores son inevitables porque normalmente 
utilizamos un instrumento para medir un número real ya en si mismo de 
medida impracticable. Estos errores se pueden cuantificar mediante estudios 
estadísticos que nos den la media y la desviación típica, y a partir de estos 
estudios, minimizarlos. 


Una nueva clase de errores son los debidos a la máquina utilizada para 
calcular. En este caso se trata de la pérdida de cifras significativas o bien por 
truncamiento, o bien por redondeo, es decir, añadiendo o disminuyendo 
en una unidad la última cifra conservada, según que la primera cifra des- 
preciada sea mayor o igual que cinco o menor que cinco. Este redondeo se 
llama simétrico y aunque existen otras modalidades es el que habitualmente 
utilizaremos. 


Los últimos errores que se cometen son debidos al propio método númeri- 
co. Al resultado de cada operación que realizamos le aplicamos a su vez un 
error de redondeo para ajustarnos al número de cifra con el que operamos y 
prescindimos así del resto de las cifras. Hemos de fijar previamente una cota 
de error para la aproximación que deseamos obtener. En general conoceremos 
una estimación del error cometido en el proceso en función de las característi- 
cas del mismo. De esta forma, la cota de error fijada nos indicará el número 
de cifras significativas con el que debemos operar, y la estimación de error del 
proceso. Una consecuencia de todo ello es la elección idónea del método que 
debemos aplicar a un determinado problema. De ello depende la complejidad 
del trabajo que vamos a realizar y el tiempo de cálculo del ordenador. 


Otra cuestión importante es la relatividad del error en la naturaleza del 
problema. No es lo mismo equivocarse en diez personas en la medida de una 
población de cien, que equivocarse en diez personas en una población de cien 
mil. Esto nos lleva a distiguir el error absoluto, diferencia entre el valor 
exacto y la aproximación obtenida, y el error relativo, diferencia entre el 
valor exacto y la aproximación obtenida en relación con la cantidad medida. 
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En el ejemplo anterior el error absoluto es el mismo en los dos casos, en 
cambio el error relativo es 0, 1, es decir el 10% en el primer caso y 0, 00001, 
es decir, el 0,001 %, en el segundo. 


No trataremos aquí conceptos como el de precisión y exactitud o cues- 
tiones como la representación de los números en el ordenador. En [18] de la 
Bibliografía puede encontrase una presentación muy sencilla, ilustrada con 
ejemplos de todas los temas anteriores. Utilizaremos el signo œ para indicar 
que se trata de una cantidad aproximada 


1.3. Problemas del capítulo. 


El Análisis numérico es una de las grandes ramas de las Matemáticas. 
El capítulo pretende ser únicamente una breve introducción a la materia y 
mostrar algunos ejemplos de problemas. El lector interesado en profundizar 
encontrará en la Bibliografía del final algunas obras que le ayudarán a com- 
pletar el tema. 


Los problemas que abordamos aquí son los siguientes: 


a) La aprorimación de las raíces de una ecuación con un error menor 
que una cantidad fija. Se emplean tres métodos: el de la bisección, el de la 
Regula Falsi y el de Newton Raphson. En los tres casos se trata de construir 
una sucesión (£p) convergente a la raíz £ y conocer una cota del error que 
cometemos al sustituir € por un determinado £n. 


b) La aprorimación de una función por un polinomio. Conocemos como el 
polinomio de Taylor aproxima la función con una cota de error proporcionada 
por el resto. El problema que estudiamos ahora es el de interpolación. Se trata 
de encontrar un polinomio que pasa por n puntos de la gráfica de la función. 
El método que exponemos es el de los polinomios de Lagrange. Es un método 
sencillo y muy claro, aunque en general no es el más idóneo para resolver el 
problema porque su construción a partir de n+1 puntos es independiente de 
su construción para n puntos, con lo que el trabajo realizado para obtener 
éste último no es aprovechable para obtener el primero. 


c) La derivación numérica. Se trata de encontrar una aproximación de la 
derivada de la función en un punto. Á partir de la expresión del límite que 
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define las derivadas se construyen las fórmulas que las aproximan. También 
podemos considerar las derivadas en el punto de un polinomio que aproxime 
la función. 


d) La integración numérica. La idea utilizada para la aproximación de la 
integral es la del método de exhaución, es decir, en esencia la de la propia 
definición de integral. Se expone la regla de los trapecios, que consiste en 
calcular el área de una poligonal inscrita en la curva. Cada lado de la poligonal 
lo determina el polinomio interpolador de primer grado (la recta) en cada dos 
puntos consecutivos de la partición del intervalo. 


Para todos estos problemas existen diferentes métodos de resolución, al- 
gunos de ellos con variantes que los mejoran sensiblemente. El espacio reser- 
vado a un capítulo no permite profundizar en estos métodos. Como ya hemos 
comentado, su único objetivo es introducir el tema. 


1.4. Objetivos. 


1. Separar las raíces de una ecuación. 


2. Aplicar el método de la bisección para determinar una solución apro- 
ximada de la ecuación. 


3. Aplicar el método de la Regula falsi y su variante de las cuerdas para 
determinar una solución aproximada de la ecuación. 


4. Aplicar el método de Newton-Raphson para determinar una solución 
aproximada de la ecuación. 


5. Determinar los polinomios interpoladores de Lagrange para aproximar 
una función con un error menor que una cota fijada. 


6. Determinar los polinomios interpoladores de Lagrange en el caso par- 
ticular en que el paso es constante. 


7. Utilizar las fórmulas de derivación numérica para aproximar la derivada 
de una función. 


8. Calcular una aproximación de la integral de una función en un intervalo 
mediante la regla de los trapecios. 
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2. Resolución aproximada de ecuaciones. 


Consideremos una función real de una variable real f. Hemos comentado 
antes que salvo casos muy particulares la ecuación f(x) = 0 no se puede 
resolver por medios analíticos y no es posible encontrar una raíz o solución 
exacta, es decir, un número real xy tal que f(xo) = 0. Por otra parte, en la 
mayoría de los problemas que surgen en la práctica, no es necesario determi- 
nar zo, siendo suficiente con encontrar un número z’ que lo aproxime con un 
error menor que una cantidad prefijada. Por ello, los métodos de cálculo de 
raíces aproximadas tienen una gran importancia. 


En caso de ser f continua en un intervalo [a,b] y ser diferentes los signos 
de f(a) y f(b), el teorema de Bolzano nos asegura que existe al menos una 
solución zo de f(x) =0. 


Una solución zo de f(x) = 0 decimos que es una raíz separada si existe 
un entorno zo en el que la única solución de la ecuación es zo. En todo los 
procedimientos que vamos a estudiar supondremos que todas las raíces son 
separadas. 


No siempre es posible separar las raíces, pero si conocemos su número 
podemos seguir el procedimiento que ya hemos adelantado en el Ejemplo 6.4. 
c). Consiste en considerar particiones del intervalo y estudiar los signos de 
los extremos de los subintervalos, descartando aquellos en los que la función 
tiene signo constante y por tanto no puede existir raíz. En el ejemplo citado 
considerabamos la división de [a,b] en dos subintervalos de igual longitud, 
después en cuatro, después en ocho,...etc. 


En el caso particular en que la función f sea derivable en (a, b), estudia- 
mos el signo de la derivada y determinamos los subintervalos de crecimiento 
(f'(x) > 0) y decrecimiento ( f'(x) < 0) de f. Si en uno de estos subinter- 
valos la función cambia de signo en los extremos, únicamente puede existir 
una raíz en él. Nótese que en caso contrario habría un máximo o un mínimo 
local y necesariamente se tendría que anular la derivada en ese punto. lo 
que contradice que el signo de f'(x) sea constantemente positivo o negativo. 
Recuérdese también que los intervalos de crecimiento y decrecimiento los de- 
terminan los extremos locales de f. Por otro lado es obvio que si el intervalo 
de definición de f no es acotado, por ejemplo todo R, el razonamiento es 
idéntico. 
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a) La función f(x) = ?—3x+1 tiene sólo una raíz en |—2, 0]. La derivada 
f'(x) = 3x2? — 3 se anula en z = —1 y z = 1. Como en el intervalo (—2, —1) 
la derivada f'(x) es positiva, la función es creciente, y por ser f(-2) < 0 
y f(—1) > 0, la ecuación tiene una única raíz. En el intervalo (—1,0) la 


derivada es negativa y la función es decreciente, pero f(—1) > 0 y f(0) > 0, 
por tanto no tiene ninguna raíz. 


b) Determinemos el número de soluciones reales de zf — 4z — 1 = 0 
separando sus raíces. La derivada f'(x) = 4z? — 4, se anula únicamente en 
z=1. 

Como en (—oo,1) la derivada es f'(x) < 0, la función es decreciente. 
Además para k < 0 tan pequeño como queramos f(k) > 0 (el límite en —oo 
es 00) y f(1) < 0, luego en (—oo, 1) tiene una única raíz que se encuentra en 
el intervalo [—1, 1] ya que f(—1) > 0. 

Como en (1,00) la derivada es f'(x) > 0, la función es creciente. Además 
F(1) <0 y para k > 0 tan grande como queramos f(k) > 0 (el límite en oo es 
00), con lo cual tiene otra raíz en este intervalo. Obsérvese que esta segunda 
raíz se encuentra en el intervalo [1,2] ya que f(2) > 0. 


Todos los métodos de aproximación de una raíz € con un error menor 
que una cierta cantidad e > 0, se basan en encontrar una sucesión de puntos 
(£n) que converja a €. Entonces la solución buscada Y es cualquier valor de 
la sucesión £n que cumpla |£n — €] < e. Para asegurarnos de ello debemos de 
obtener una relación del tipo 


¡E za < k |En anal <E 


en donde k es una constante. De esta manera si |£n — £n-1| < €/k, entonces 
18 —T| < e 

Los métodos que estudiamos a continuación sólo se diferencian en la forma 
de obtener la sucesión. El primero de ellos, método de la bisección, lo hace 
a través de una sucesión de intervalos encajados que contienen a € y cuyas 
longitudes tienden a cero. 
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2.1. Método de la bisección. 


Sea € € (ao, bo) tal que f(€) = 0. Supongamos que queremos obtener una 
raíz aproximada Y de la ecuación con un error menor que e > 0, es decir, 
tal que |E — T| < £. Consideramos también que |bp — ap| > €, ya que en caso 
contrario a y b serían soluciones del problema. Procedemos de la manera 
siguiente: 


1. Se determina el valor de f en el punto medio 
Tı = (ao + bo)/2 


del intervalo. Si f(x,) = 0, entonces zı es una raíz exacta. 

2. Si f(x1) 4 0, entonces f(x1) tiene distinto signo que f(a) o f(b). Sea 
(a1, b1) el intervalo (ay, 71) o (x21,bo) en donde se encuentra la raíz. Sea Zo 
igual al extremo del intervalo en donde se encuentra la raíz. Si |1, — zo| < €, 
entonces zı es la solución buscada. 

3. Si [11 — tol > €, se determina el valor de f en el punto medio xa del 
intervalo (a1, b1). 

Ta = (ai + b1)/2 


Si |z2 — zı| < e, entonces xa es la solución buscada. 
4. Si |£2 — x1| > e, se reitera el proceso. 


La longitud de cada intervalo I„ = [an, bn] es igual a 
[bn — an| = [bo — ao| /2”, 


si ny es el menor número natural tal que |b — a| /2"™° < £, el máximo número 
de pasos necesarios en el proceso es no. En efecto, si T es el punto medio del 
intervalo Jno, como é£ € Ino, se cumple 


n= 
[bo — aol oj 


w o 1] Dno 


Tal como mostramos en el Ejemplo 6.4. c), en caso de tener f(x) = 0 un 
número finito de raíces, el método nos permite separar las raíces estudiando el 
signo de los subintervalos que van determinando las sucesivas particiones de 
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[ao, bo] de norma |bo — ap| /2”, es decir, dividiendo fao, bọ] en dos subintervalos 
de igual longitud, estos en otros dos de igual longitud y así sucesivamente. 


10.2. Ejemplo. 


a) Determinemos la raíz en el intervalo [—2, 0] de z? — 3x+1 = 0 con un 
error menor que e = 107!. 

1. Como f(-2) < 0 y f(0) > 0, existe al menos una raíz en [—2,0]. El 
punto medio del intervalo es 1, = —1 y f(—1) = 3, luego la raiz se encuentra 
en (-2, —1). Como |-1 — (-2)] = 1 > e, reiteramos el proceso. 

2. El punto medio de (-2,—1) es 12 = -3/2 y f(-3/2) = 17/8, luego 
la raíz se encuentra en (—2, —3/2). Como |-2 — (-3/2))] = 1/2 = 0,5 > e, 
reiteramos el proceso. 

3. El punto medio de (—2, —3/2) es 13 = —7/4 y f(-7/4) = 57/64 = 
0, 89063, luego la raíz se encuentra en (—2, —7/4). Como |-2 — (-7/4))| = 
1/4 = 0,25 > e, reiteramos el proceso. 

4. El punto medio de [-2, —7/4] es z4 = —15/8 y f(-15/8) = 17/512 = 
0,332, luego la raíz se encuentra en (—2, —15/8). Como |-2 — (-15/8))] = 
1/8 = 0,125 > e, reiteramos el proceso. 

5. El punto medio de (-2,—15/8) es zs = —31/16 y f(-31/16) = 
—hs = —0,460, luego la raíz se encuentra en (-31/16,-15/8). Como 
|-31/16 — (-15/8))| = 1/16 = 0,0625 < e. 

Los puntos, Z = —31/16 y z = —15/8 y todos los puntos del intervalo 
(-31/16, —15/8) son raíces aproximadas de la ecuación con un error menor 
que e. 


2.2. Método de las cuerdas (regula falsi). 


Este método es similar al anterior, en el sentido de que su proceso es 
análogo salvo que el punto medio se sustituye por el punto de intersección con 
el eje Ox de la cuerda que une dos puntos de la gráfica de y = f(x). El nombre 
de regula falsi procede precisamente de que se sustituye la intersección de 
la gráfica de f por la de la recta que determina la cuerda. Aventaja en 
efectividad al método de la bisección, pero su desventaja es que, en general, 
las cotas de error no se pueden determinar de la misma manera. Se trata de 
encontrar una sucesión (£n) que converja a la raíz. 
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Figura 1: Sucesiones convergentes a la raíz. 


Recordemos que la ecuacion de la recta que une dos puntos (a, f(a)) y 
(8, $(8)) es 
a O 


Ba  f(B)- fla) 


con lo que su punto de intersección con y = 0, viene dado por 


P=a 
z=B- f(6) 070 
F(8) — fla) 

Partimos de f continua en [ag, bo] con f(ao) y f(bo) de distinto signo y 
queremos encontrar una solución aproximada 7 de la raíz £ € (ao, bo) de la 
ecuación f(x) = 0, con una cota de error € > 0. Procedemos de la siguiente 
Manera: 


1. Determinamos el punto 


e A 


de intersección de la cuerda que une los puntos (ao, f (ao)) y (bo, F(bo)) con 
el eje Oz. 
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2. Si f(xı) = 0, entonces x, es la solución buscada. En caso contrario la 
raíz se encuentra en uno de los subintervalos (ay, 11) o (x1, bo) . Designemos 
por [a;, b1] el intervalo en que se encuentra la raíz (es decir aquel en que f (a1) 
y f(b1,) tienen distinto signo). 

3. Si |b; — a| < e, entonces xı es la solución buscada. 

4. Si |b — az] > e, se reitera el proceso para el intervalo [a1, b1]. 


Obtenemos así dos sucesiones {an} y {bn}, véase la Figura 1, tales que 
ao < Ar Er US e o TO < bo 


y si ambas sucesiones convergen a €, entonces paramos el proceso para 
[bn — an| < £. Si no es así, y por ejemplo la sucesión (an) converge a £, 
podemos parar el proceso si |an — an ¡| < € y considerar como una solución 
aceptable a, sin que ello suponga que e es cota del error cometido. 

Las dos sucesiones son monótonas acotadas, ambas tienen límite, y al 
menos una de ellas converge a £. Sin embargo, si una de las dos no converge 
a €, entonces bn — an no converge a 0 y la longitud de los intervalos [aņ, bn] no 
nos permite considerar errores tan pequeños como queramos. Véase la Figura 
23 





Figura 2: Sucesión (b,,) constante. 
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Estimación del error. 


Podemos dar una estimación del error en el caso en que exista derivada 
segunda continua de la función en [ag, bo] y f” tenga signo constante. En este 
caso uno de los extremos permanece fijo, es decir, una sucesión es constante, 
mientras la otra converge monotonamente a £. Supongamos por ejemplo que 
f"(x) > 0, (el caso f(x) < 0 se reduce a él si consideramos la ecuación de la 
forma — f(x) = 0) y que la sucesión constante es bn = bo, (véase Figura 2), 
entonces las aproximaciones sucesivas vienen dadas por 

bo — On-1 
jo aA ka - en] 


Si el ínfimo de f'(x) en [ao, bo)] es m’ > 0 y tenemos en cuenta que f(E) =0, 
aplicando el teorema del valor medio a f en el intervalo [a,, €], existe An € 


(An, E) tal que 








Ifan)l _ |£(am)| 
PO) =m 


Tenemos así una primera estimación del error cometido. Además del valor 
de f(a,-1) obtenido de la fórmula de recurrencia, como f(£) = 0, resulta 


+ f (bo) e T) 


bo — An-1 


FE) — Flan) = FON)E — On) laa El < 


FE) — Flan=1) (An — An-1) (1) 


y aplicando el teorema del valor medio a f en [a,-, €], existe An-1 € (Qn-1, £) 
tal que 


FE) — Flan-1) = POn— (E =n-1) (2) 


y de nuevo aplicándolo en el intervalo [an-1, bo] , existe Hn-1 E (@n-1, bo) tal 
que 


f (bo) — F(an-1) = F'(Un—1) (00 — an-1) 
con lo que 


f (bo) a Tlo 


E (6621) = S Hn) (00: — Un-1) 


entonces, teniendo en cuenta (1) y (2), resulta 
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POr -= Am 1) = Ple = Am 1) 


o lo que es equivalente 


FORENE — ün 5 ûn — an) = PANOR E An —1) 


con lo que 


FO E — anal $ ala = Qn-1) = Pa — an1) 


de donde 17 y 
Ja Pn-1) — de Án—1 a 
E a 


Entonces, si 0 < m’ < |f'(x)| < M’ para todo z € fao, bo], como Hn-1 y An-1 
pertenecen al intervalo, se tiene |f'(fn-1) — F(An-1)] < M' —m*, con lo cual 


IE — an| = 


/ / 


¡5 03] < 


y obtenemos una estimación del error que involucra la longitud del intervalo. |an, an- 


E (2 = 221! 


10.3. Ejemplo. 


Determinemos una raíz aproximada en el intervalo [1,2] de la ecuación 
— x — 1 = 0 con un error menor que e = 107}. 

Como el mínimo y el máximo de f'(x) = 3x? — 1 son 2 y 11, f"(x) = 6x 
es positiva en [1,2], y la sucesión que permanece constante es el extremo 
by = 2, resulta que 


r? 


M= Z% 





¡ESAS la. 111107 

con lo cual ha de ser |an — an-1| < 0,2x107* = 0, 02. Teniendo en cuenta que 
F(1) = —1 y f(2) = 5, los puntos que definen la primera cuerda son (1, —1) 
y (2,5). Si consideramos tres cifras decimales en los cálculos y realizamos un 
redondeo simétrico, resulta 


0. ao = I; FO) =-1 


L 
bo — âo | 1 


A e O) 
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Como |1,167 — 1| = 0, 167 seguimos iterando. 
2. f(1,167) ~ —0, 578, 


2 — 1.167 
Ao dE 
o E S 


Como |1,253 — 0, 167| = 0,086 seguimos iterando. 
3. f(1,253) ~ —0, 286, 


~ 1,253 


2 — 1,253 
= 1,25 288——— 21,2 
a3 , 253 +0, SOTET , 293 


Como |1,293 — 1,253| = 0, 04 seguimos iterando. 
4. f(1,293) = —0,131, 
2 — 1,293 


OS a e E 
A AA 


Como [1,311 — 1, 293] = 0,018 < 0, 02. 
Luego 1,311 es una raíz aproximada con un error menor que e. 


La fórmula de iteración. 


Una variante del método anterior es el método de la secante, que 
consiste en construir a partir de los puntos iniciales (ap, f(ao)) y (bo, F(bo)) 
la sucesión (£n) de la manera siguiente 


To = Ap, Tı = do, 


LIn-1 — Tn-2 
Laa) v T =a) 


Puede ocurrir que algún x,, no pertenezca al intervalo [ao, bp] y no pueda 
construirse toda la sucesión, pero si esto no es así, (£n) converge hacia una 
raíz £ de f y si f' es continua se cumplen la estimaciones del error encontradas 
antes. 


Tn = Tn-1 7 flsm=1) para n > 2 


10.4. Ejemplo. 


En la ecuación z? — x — 1 = 0 e intervalo [1,2] del ejemplo anterior, 


determinemos la raíz aproximada que se obtiene al realizar seis iteraciones 
del método.. 
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la y t=? 


A EEE 


le 
Ty = 5 





= 1,1667 
Ep 
3. f(1, 1667) = —0, 5786. 
2 — 1,1667 
=1,1 cie le L 
za = 1,1667 + 0, 578655725 =1,2581 


4. f(1,2531) = —0, 2854. 
1, 1667 — 1,2531 


5. f(1, 3372) = 0,0539 
1,2531 — 2 
n= ae -o o ee A R 


—0, 2854 — 0, 0539 


6. f(1,3238) = —0, 0039 
ze = 1,3238 +070039 = 1,3247 


Por tanto la solución buscada es 1,3247, que obviamente es una aproxi- 
mación mejor que 1,311 encontrada en el Ejemplo 10.3. 


2.3. El método de Newton-Raphson. 


En este método se sustituye la gráfica de la función por la recta tangente 
en uno de sus puntos. Es más eficaz que los dos anteriores, en el sentido de 
que su convergencia es más rápida, aunque no es tan general pues exige la 
existencia de la derivada. 

La ecuación de la tangente en un punto cualquiera (zo, f (£o)) es 
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y = f(2o0) + f(xo)(x — xo) 


y su intersección con el eje Ox es 





Si repetimos el proceso para el punto xı, determinamos el punto zx, y así suce- 
sivamente. En general para £n, resulta 


con lo que obtenemos una sucesión, e igual que en el método anterior puede 
ocurrir que algún zx, no pertenezca al intervalo lap, bp] y no se pueda construir 
toda la sucesión, pero si esto no es así, (1, ) converge hacia una raíz £ de f. 
La expresión anterior se denomina fórmula de recurrencia o iteración 

Entonces, si queremos encontrar la raíz £ de la ecuación f(x) = 0 en el 
intervalo [ao, bp] con un error menor que e > 0, procedemos de la siguiente 
manera: 


1. Comenzamos con un punto arbitrario del intervalo (zo, f (£o)) y deter- 
minamos el punto xı de intersección de la tangente en (Zo, f (£o)) con el eje 
Ox. 


2. Si |x1 — E| < e, entonces zı es la solución buscada. 

3. Si [11 — €] > e, se determina zz intersección de la tangente en (21, f(21)) 
con el eje Oz. 

4. Si |£2 — £| > e, se reitera el proceso hasta encontrar £n tal que |1, — E| < 


Estimación del error. 


Podemos dar una estimación del error en el caso en que exista derivada 
segunda continua de la función en el intervalo [ao, bo] y f'(x) y f"(x) tenga 
signo constante en |[ao, bp]. Bajo estas hipótesis, la raíz £ es única ya que la 
función es creciente o decreciente por ser constante el signo de la derivada. 
Además la sucesión (£n) converge monótonamente a €. Razonémoslo para uno 
de los casos. Los demás pueden reducirse a él o razonarse de forma análoga. 
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Supongamos f(aọ) < 0, f(b) > 0 y f'(x) > 0, f”"(x) > 0 para todo 
x E lao, bo] y consideremos zo = by. Sea E = Ln + (€ — £n) y desarrollemos 
por la fórmula de Taylor en £n en potencias de (€ — £n) 


0 = F(E) = Flan) + Flan NE— am) + 5F"(0n)(E— n)? 
en donde cn € (£n, €). Como f”(cn) > 0 y f'(2n) > 0, necesariamente 


f' (En) 


Como en [£, bp] la función es positiva, con lo que f (£n) > 0 y por hipótesis 
"(2 ) > 0, entonces Fen > 0, £n > Ẹ y la sucesión está acotada inferior- 


mente. Además, teniendo en cuenta la fórmula de recurrencia, resulta 


PE 


kas o 
n 





Ftn) + F'(En)(E — Tn) < 0 => HE < Zn 








Luego la sucesión es monótona decreciente y tiene límite. Además su límite es 
la raíz. En efecto, si lím £n = s, tomando límites en la fórmula de recurrencia 
n—>00 





luego s = £. 


Considerando para los intervalos [x,,, bp], un razonamiento idéntico al que 
hicimos en el método de la regula falsi, si 0 < m < |f'(x)| < M’ para todo 
x € lap, bo], se cumple: 


al AA 
b) -als M-m 


mi (En — Ln-1 


10.5. Ejemplo. 


Determinemos la raíz aproximada de 1?+2x—1 = 0 en el intervalo [0, 1/2] 
con un error menor que e = 1074. 
Como 
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Figura 3: Método de la tangente. 


MO ==17FM2)= 1/8, FO) = 32402 0/7 (2) =60>0 


para todo x € [0,1/2], la función es creciente en el intervalo y existe una 
única raíz €. Además 0 < 2 < |f'(x)| < 11/4 = 2,75 en donde 2 = mín | f'(x)| 
y 2,75 = máx|f"(x)|. Es decir buscamos £n tal que 


m 2 


A 1 -4 m 


lea “inei < 


Aplicamos la fórmula de iteración 


fer 

f'(tn-1) 

con valores de cuatro cifras y redondeo simétrico. Entonces tenemos: 
== 05 045) = 0.1257 P1005)= 2,150 


Tn = Tn-1 — 


0,125 
= 0,5 2 x 0, 4546 
De 
Como |0, 5 — 0, 4546| = 0, 0 454 seguimos iterando. 
2. f(x1) ~ 0,0031, f'(x1) = 2. 4903 


0, 0031 
2, 4903 





z2 = 0, 4546 — ~ 0, 4534 
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Como |0, 4546 — 0, 4534| = 0,0012 seguimos iterando. 
3. f(22) = 0,0000, f'(z2) = 2,6167 


0, 0000 


snra LE 
o 2,6167 


= 0, 4534 
Como |0, 453 4 — 0, 453 4| = 0 < 0,0002, luego 0, 4534 es la solución bus- 
cada. 


3. Interpolación polinómica. 


En el Capítulo 6 vimos como el teorema de Taylor nos permitía aproximar 
una función f(x) mediante un polinomio P(x). La idea era encontrar P(x) 
de modo que coincidiera en el punto zy con f(x) y alguna de sus derivadas, 
El error cometido lo estimabamos mediante una cota del resto. 


Otro método de aproximación de una función es la interpolación polinómi- 
ca. La idea es encontrar un polinomio que tome el mismo valor que la función 
en un conjunto finito de puntos distintos (zp, T,,...., Tn), llamados puntos 
de paso, es decir que se cumpla 


Pl) PUNA (E Plen) Ej 


Como el polinomio P(x) ha de satisfacer n + 1 condiciones, es natural que 
consideremos como candidato a un polinomio de grado menor o igual que n, 
ya que los coeficientes que debemos determinar son también n + 1. 


En primer lugar, sólo existe un polinomio P(x) que cumpla las condiciones 
anteriores. En efecto, si Q(x) es también un polinomio de grado menor o igual 
que n que las cumple, entonces R(x) = P(x) — Q(x) es de grado menor o 
igual que n y se anula en los puntos Tọ, 21, ...., Zn, con lo cual tiene que ser 
idénticamente cero, y si R(x) = 0, necesariamente los coeficientes de cada 
monomio son iguales y P(x) = Q(x). 


A los puntos zo, %1, .-.--, £n también se les llama nodos. Si el número de 
nodos es dos, el proceso se denomina interpolación lineal, pues la gráfica 
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del polinomio es una línea recta Existen numerosas técnicas de interpolación 
polinómica: métodos de Lagrange, Newton, Gauss, Chevyshev, etc. Estudia- 
mos únicamente el método de Lagrange, lo que nos permitirá adquirir una 
idea clara del problema y su resolución. 


3.1 Método de Lagrange. 


Consideremos el polinomio de grado n + 1 


A(x) = (1— zo)(x — 21).....(1 — Tn) = [ [te — zi) 


Este polinomio tiene un cero en cada uno de los puntos x;. Sea ahora el 
polinomio A(x) de grado n obtenido al suprimir el factor (x — zx) en el 
polinomio A(x) 

n 


Asla)= |] (x-=x;) 


i=0, i£k 
A(x) tiene un cero en cada uno de los puntos z; 4 2, y su valor en £p es 


n 


Arlan) = || (=-=;)7%0 


¿=0, ifk 


Como consecuencia, el polinomio Az(x)/Ax(tx) toma el valor 1 si £ = £p y 
el valor 0 si x= z; e i Æ k. Entonces, el polinomio 


Ag(x) 
Ap(2y) 





P(a) = $ f (zx) 


satisface las condiciones iniciales. En efecto, para un valor fijo x = xj se 
anulan todos los sumandos que en la fórmula anterior definen a P(x) salvo 
el correspondiente al índice j, ya que según acabamos de ver, si i Æ J 


Ae — La 
ANT PE A;(z;) 
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Por tanto P(x;) = f(x;) para todo j = 0,1,... n 
A los polinomios 

Ap(x) 

De) = 


se les llama polinomios de Lagrange y a la expresión 


=>) f(2x)Lr(z) 


k=0 





fórmula de interpolación de Lagrange. 


10.6. Ejemplo. 


Mediante la interpolación de Lagrange determinemos el polinomio inter- 


polador y el valor f(1,5), si en los puntos zy = —1, zı = 0, ta = d v= 5 
la función toma los valores f(—1) = 2, f(0) = 0, TE =al oS 
Se tiene 


A(x) (EFD — 0)(x aa — 5) 


El polinomio interpolador es 


P(x) = 2Lo(x) + 0L1(x) + 4Lo(x) — L(x) 


entonces 
mo A A z e Ta 
ros — - > = la — 72? +72 + 15) 


M Ma oni 
= e a a — Dt 
o 
Haciendo las operaciones y simplificando 


4 4, 1 
P pl E 
(== ¿04 ya ye 


El valoren x = 1,5 es P(1,5) = 1, 625. 
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3.2. Puntos de interpolación con la misma separación. 


Supongamos que los puntos (Zo, 21,...., £n} son tales £o < £i < .... < Tn 
y las distancias entre dos consecutivos son todas iguales a h, a esta distancia 
fija h le llamamos paso, es decir, h = 241 — £z; para todo j = 0,1,...,n, con 
lo cual 
Tj = To + jh 
y por tanto 
E — 2, =(k — j)h 


Entonces los polinomios de Lagrange se transforman en 





en donde hemos hecho el cambio de variable t = (x — xp)/h. 
Ahora bien, como el último producto es 


SLU 
Ar p= a T m 


calculamos el valor de cada uno de los paréntesis para determinar la expresión 
de L(x) de forma más sencilla y manejable. En efecto, si consideramos los 
subíndices de 0 a k — 1 y de k+ 1 a n obtenemos 





j=0, ¡Ak j= =k+1 
como 
m 1 _ 1 1 DL ml 
AT AA IAEA) k 
1 e 1 1 1 
aaa A A O 
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resulta que 








[AMES 


con lo cual, sustituyendo en la expresión de L(x) y teniendo en cuenta. que 
x = To + th, se verifica 





Ly (to + th) = go h) II a=) 


j=0, jk 


fórmula que facilita de manera sensible los cálculos. 
10.7. Ejemplo. 


Mediante la interpolación de Lagrange, determinemos el polinomio inter- 
polador de f(x) = cos(x? — 1)r/3 en los puntos zp = —1, zı = 0, za = 1, 
zz = 2. ¿Cuál es el valor de aproximado de f(x) en x = 0, 7?. 

Como h = 1 y n = 3 y la función toma los valores 














(1) = cos Z ==>, f0) = cos => 
(1)=cs0=1, f(2) = 0s = 
teniendo en cuenta que g= d + +, resulta 
== e (Ju m2) =- (4-38 +21) 
Li(=1+t) = =i (JE+DE-DE-2 (A 
Pd = (5) A e 2) 
E = =o (3) (a T a 


por tanto 
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1 1 1 
Prp = =3Lo(=1 +t) + ¿mil A t) F z201 +t) = 


1 1 5 1 
Po o 
— ¿E amA 
12 2 12 


y P(0,7) = 0,78475. 


Estimación del error. 


Sea f(x) definida y derivable hasta el orden n+1 en el intervalo [a, b] y los 
puntos £o, 21, ...., Zn del intervalo en el que hemos determinado el polinomio 
de interpolación P(x), entonces 


“para todo punto x € [a,b] se cumple 


A(x) 
= ¡ley => <DEL td) 

(an Era 

en donde A(s) = (r= ap — 11).....(x— tn) y c € (a, b)”. 

En efecto, supongamos que x es distinto de cualquier punto de interpo- 
lación £, pues en caso contrario A(z) = 0 y la igualdad se satisface para 
todo punto c del intervalo. Consideremos z fijo y definamos el polinomio Q(t) 
por 

Q(t) = A(z) [F (t) — PŒ] — Ate) [f(z) — P(z)] 

Es obvio que Q(t) es n + 1 veces derivable y como P(t) es de grado n 
su derivada de orden n + 1 es cero. Además la derivada n + 1 de A(t) es 
An+D (2) = (n+ 1)!, con lo cual la derivada n +1 de Q(t) es 


Qu) =A0)F() — (n + D)![A(x) — P(e)] 


Razonemos que existe un punto c € (a,b) tal que Q"+D(c) = 0. El poli- 
nomio Q(t) se anula en todos los puntos t = 2 y también en t = x, Estos 
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n +2 puntos determinan n + 1 subintervalos en [a,b] y aplicando el teorema 
de Rolle a Q(t), en cada uno de los subintervalos existe un punto en el que 
se anula la derivada (Q*(t). Estos n + 1 puntos en los que se anula Q'(t) de- 
terminan a su vez n subintervalos y aplicando de nuevo el teorema de Rolle 
a (2'(t), en cada uno de ellos existe un punto en el que se anula la segunda 
derivada Q”(t). Después de repetir el proceso n + 1 veces, encontramos dos 
puntos que determinan un subintervalo en el que aplicamos el teorema de 
Rolle a la derivada n—ésima Q™ (t) y existe un punto c del subintervalo tal 
que Q"+D(c) = 0. Por tanto, para t = c, se tiene 


0 = A(z) f(e) — (n+ DIe) — P(o)] 
y despejando f(x) — P(x) resulta 
fæ) Pla) = Er 


Como consecuencia, si conocemos una cota de |f"+D(x%)| y de |A(x)| en 
[a,b] , podremos hallar una cota de |f(x) — P(x)|. 


10.8. Ejemplo. 


Determinemos una cota del error cometido al aproximar v11 y en ge- 
neral f(x) = yz por el polinomio interpolador de Lagrange en los puntos 
(9,16, 25) 

Sea A(x) = (x — 9)(x — 16)(x — 25), se tiene 


lA(1D)| < (11 — 9)/(11 — 16)(11 — 25) = 140 


y por otro lado 


f(x) 1-12 f"(x) a 1312 f(x) a 2 
2 4 8 
con lo que 
3 
m <o 5/2 
ma oss 
Por tanto 


140 3 
vi PD E Soye ¿Y 5/2 = 0, 036008 
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y en general 
241,23 
lx —P(z)] < ds = 0, 062037 
ya que 
máx |A(=)] < 241,2 
zEe[9,25] 


pues A(x) = z3 —50x?+769xz—3600 alcanza sus sus valores máximo y mínimo 
en alguno de sus extremos relativos, en este caso en z = 1 (50 + v193) y 
z = 4 (50 — y193), que son los puntos que anulan la derivada A'(z) = 
3x? — 100z + 769. Como 


A E (50+ v53) ) EA G (50 — v53) ) = 156,02 


resulta que máx |A(x)| = 241,2. 
xE[9,25] 
4. Derivación aproximada. 


Consideremos que en un cierto punto £ la función tiene derivada 


entonces es natural suponer que la fracción anterior constituye una aproxi- 
mación de f'(£), es decir 


LEERME) 


O A 


A esta fórmula aproximada se la denomina primera diferencia progresiva. 
Obsérvese que estamos aproximando f'(€) por la pendiente de la cuerda que 


une los puntos (€, F(£)) y (€ + h, f(E + h)) 
Otra aproximación de la derivada viene dada por 


po a LENA 
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a la que se denomina primera diferencia regresiva. En este caso estamos 
aproximando f*(€) por la pendiente de la cuerda que une los puntos (€, f(£)) 
-m 

Finalmente otra aproximación mejor que las dos anteriores viene dada 
por la diferencia central 


py LES 


cuyo significado es la pendiente de la recta que une (E — h, f(E — h)) y (€+ 
h, FE +h)). 

El mismo procedimiento nos permite establecer fórmulas de aproximación 
para las derivadas sucesivas por medio de las diferencias de orden superior. 
Así, para la diferencia progresiva de segundo orden, tenemos 


d FE sE h) Rs FE 1 IO e. Awa 


ps RE : 
FEH 2h) — 2f E+ h) + FE) 
z j 


Si simplificamos la notación haciendo f (€) = fo, F(E+h) = fu1, F(E£2h) = 
f+2, etc, la diferencia anterior es 


n ZET 
Poh = fo 


la segunda diferencia regresiva viene dada por 


Fi 7 fo z a 3P fa 
d> a 
y la central por 
P E a 
MA 


Podemos continuar así el proceso indefinidamente y obtener todas las fórmu- 
las de derivación numérica cualquiera que se sea el orden de la derivada. 
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Ed 
Estimación del error 


Ahora bien, para estimar el error que cometemos es necesario que la fun- 
ción derivada tenga una cierta regularidad, por ejemplo que f posea derivadas 
continuas de orden m > 1. Las fórmulas que estudiamos a continuación se 
utilizan con mucha frecuencia y la existencia de las derivadas de orden supe- 
rior nos permiten estimar el error. 

Sea zk = Zo + kh, en donde h > 0 es el paso o longitud constante del 
subintervalo. 

Supongamos únicamente dos nodos £o y zı. Si f es de clase dos en el 
intervalo [£o, z1], entonces por el teorema de Taylor, existe c € (xp, 11) tal 
que 


fle) = Feo) + P(a)n+ Ëo 


de donde 
TED FE h 


f (xo) a e e wo 


y una cota de i f” (c) nos proporciona una estimación del error cometido. 


Si consideramos tres puntos 2_,,ZTy y xı y suponemos f es de clase tres 
en el intervalo [x_,, 11], por el teorema de Taylor 


/ h? $! hi m 
f(z) = f(z0) + f (zo)h + = (zo) + E (c1) 
2 3 
Ho) = (20) — F'(zo)h + FF "(20) - Ele) 


en donde c_¡ € (2_1,%0) y C1 E (20,71). Restando ambas expresiones y 
despejando f'(xp), resulta 


Ha) AA 

E A lec as Hi mM 

f (zo) 3h (a) +F (c-1)) 

y como f” (x) es continua en [£z—1, %1], por el teorema de los valores interme- 
dios, la función 2f""(x) tiene que tomar el valor f""(c,) + f""(c_1) en algún 
punto c del intervalo [c,, ca]. Por tanto 


Fa) fra) PP 


f (zo) 2h 6 
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y una cota de h? f” (c) nos proporciona una estimación del error cometido al 
aproximar f'(2p) por la fracción. 

Si suponemos que f es de clase cuatro, un razonamiento idéntico al an- 
terior demostraría que 

a Ae E A E 
To) = === — — fe 
J (zo) 2 TA (c) 

(se propone como ejercicio) y así sucesivamente podemos obtener las aproxi- 
maciones de las derivadas de f y las cotas de error cometido. 


10.9. Ejemplo. 
Determinemos el valor aproximado de las derivadas primera y segunda de 
en x = 1 siendo A = 0,1. 


A 
0,9? 1 ME 


Como f(0,9) = 0241 0,44751, (1) = z f(1:1) =E 


0, 547 51, resulta 





0,54751 — 0,44751 


/ 
1 = 
4751-2 44751 
mer 7 ,0,5+0,4475 = —0, 498 
oie 
Si derivamos la función, los valores exactos son f'(1) = 1 y f”(1) = —0,5, 


con lo que hemos obtenido una buena aproximación. 


4.1 Derivación mediante el polinomio de interpolación. 


Podemos también obtener la derivada aproximada de la función derivando 
su polinomio de interpolación de Lagrange P(x), resulta así la fórmula 


Si la función es de clase n +2 en el intervalo, se demuestra que el error viene 
E 
dado por 


Introducción al cálculo numérico 338 





a! maa ; 


en donde c y cl son puntos del interior de [a,b]. 
10.11. Ejemplo. 


Sea f una función desconocida de la que hemos obtenido por observación 
de un determinado fenómeno la siguiente tabla de valores: 


Tk 0 1 2 
f(E) 0,541 0,522 1,852 


Como h = 1 y £o = 0, teniendo en cuenta que 


Ly(zo + th) = Ly(t) = =- (7) lI (t — j) 


j=0, ¿Hk 





resulta 


Lo(s0 + th) =3 (6102) = ze æ: si +1 
Li(2o + th) = = — 2) = —t* + 2t 


T pi 
La(z£o + th) = Sie —)= e 


y sustituyendo t = 4, su polinomio interpolador de Lagrange es 


3 1 1 
P(x) = 0,541 (e -Ža +1) +0,52 (- hi 2429) 41,852 (30 -že = 


= 0,6745x* — 0, 6935x + 0,541 
y su derivada aproximada es 
f(x) = P'(x) = 1,349x — 0, 6935 


Para determinar el error necesitaríamos conocer una cota de las derivadas 
de f. En la observación de algunos fenómenos físicos y debido a su naturaleza, 
podemos suponer que las derivadas función del modelo estén acotadas por 
determinados valores. 
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5. Integración aproximada. 


En muchos casos es necesario obtener una aproximación del valor de 
e f(x)dx, bien porque la función f no tenga primitiva, bien porque la fun- 
ción tenga una expresión muy complicada o simplemente porque sólo sea 
necesario conocer un valor aproximado cuya cota de error al sustituirlo por 
el de la integral sepamos calcular. 


En esencia el problema que planteamos ahora es encontrar una función 
g que aproxime a f en el intervalo [a,b] de modo que podamos sustituir el 
valor de 1 f(x)dx por el de e g(u)dx con un error menor que una cantidad 
prefijada. Naturalmente, y tiene que ser una función cuya integral en [a, b] 
sea fácilmente calculable. 


El método más sencillo se conoce con el nombre de regla de los trapecios 
y consiste en sustituir a f por una función poligonal tal que los extremos 
de los segmentos sean puntos de la gráfica de f. En otras palabras, se susti- 
tuye f por la función que se define por medio de la interpolación lineal en 
cada subintervalo. Este método se conoce con el nombre de Regla de los 
trapecios. Véase la figura. 


a Tı L2 T3 L4 TL5 Te b 





Figura 4: Regla de los trapecios. 


Consideremos el caso en que los subintervalos tienen la misma longitud, 
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es decir el paso es constante. Sea una partición 
PE la ia Zo a mb 


Z 2 De- 
signemos 2, = a + kh, entonces para cada k = 0, 1,...,n— 1 aproximamos la 
gráfica de f en el subintervalo [2;, 24,1] por el segmento de recta que une los 
puntos (£k, f (£k)) y (Lrr1, f (£k+1)), es decir utilizamos un polinomio lineal 
para interpolar entre dos puntos consecutivos. De esta manera la función 
poligonal g queda definida por 





de [a,b] formada por n subintervalos de la misma longitud h = 





Lk+1 — 5 a i 
g(a) = LE f(z) + O Si SETS Php 


h h 


cuya integral en el subintervalo [2z, tx+1] es 


eS g(=)dx = Esad A dile) no sdr+ 


= h h 
Tk+1 
+ pt rl E ps (2k41 t Tp) 
Tk 


con lo cual, una vez simplificado, se tiene 


x haan f (tx) uien, 


Entonces, sumando las integrales correspondientes a todos los subintervalos, 
resulta 


f stayaz = FY 00 + Fee) 


k=0 


Si la función f posee derivada segunda continua, el siguiente resultado per- 
mite calcular una cota del error cometido al sustituir la integral de f por la 
de g. 
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Estimación del error. 


Supongamos que f tiene derivada segunda continua en [a,b] y g es la 
función poligonal determinada por una partición de [a, b] en n subintervalos 
iguales, entonces se cumple 


| toi- f soa- LE pr 


En efecto. En un subintervalo [£k, £k+1], como g(x) es el polinomio de inter- 
polación lineal, el error cometido al aproximar f por g es 


ÓN a 





f(x) — glu) = (£ — zs)(x — Eu+1) 


en donde ck E (£k, Tx+1). Sean M y m el máximo y el mínimo que alcanza 
f"(x) en el intervalo [a,b] y consideremos la función positiva en [2y, £k41] 


olz) =5(0— alar — 2) 


entonces en [£k, Tx +1], como 





ga) = $(a) = pl) LE 


se cumple 
miplx) < g(x) — f(x) < Molz) 


integrando en el intervalo, resulta 


n [e E f ala) moe VA il hy O 


Si hacemos el cambio £x = £k + t, Try] = Tk + h, entonces t varía desde O a 
h, con lo cual la integral de y(x) es 


Tk+1 Tk+1 1 i 1 h h3 
f píx)idx = "i z7 aca) 3 5/ t(h — t)dt = D 
Tk T 5 0 


k 


Por tanto, sustituyendo este valor en la última desigualdad 
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m< | oa) -tad M 


y sumando las integrales de todas las desigualdades anteriores en cada uno 
de los n subintervalos 


nms 73 / (gla) — f(2))dz < nM 


Como f”(x) es continua en [a,b] en algún punto c del intervalo tiene que ser 


y por tanto 


338 Capítulo 10 
Ejercicios y cuestiones propuestos 
1. Estudiando el signo de la derivada, determínese el número de raíces 


que tiene cada una de las ecuaciones y un intervalo cerrado y acotado que 
las separe. 


ae —=0 

b) In(x* +2) =0 
cos ds Fra 
d) a? — z3 +2 =0 


2. Determínese el número de raíces reales y aproxímese una raíz de la 
ecuación 2z? + x — 2 = 0 por medio de dos iteraciones en el método de 
Regula Falsi. Señálese una cota del error cometido. 


3. Aplíquese el método de la bisección a z? —19 = 0 para determinar Y/19 
con un error menor que 1072. 





4. La función f(x) = 


de las sucesiones determinadas por el método iterativo de Newton-Raphson 
si se comienza en zo =0 y en qto = 1. 


-1 1 
z S€ anula en z = 3 Estúdiese la convergencia 


5. La ecuación zt — z — 1 = 0 tiene una raíz en el intervalo [0, —1]. 
Determínese por el método de Newton-Raphson una aproximación con un 
error menor que 0,3 - 1072. 


6. Sea la ecuación 1?—2x—1 = 0. Aplicando el método de las secantes, de- 
termínese el número de iteraciones necesarias para obtener una aproximación 
con un error menor que 107? de la mayor de sus raíces. 


7. Determínese con un error menor que 107! la raíz de e? — gz = 0 
utilizando los métodos de la bisección, de Regula Falsi y de Newton-Raphson. 


8. Determínese el valor de e%% mediante el polinomio de Taylor de orden 
tres. Calcúlese una cota del error cometido. 


9. Determínese el polinomio de interpolación lineal si f(1) = 2 y f(3) = 5. 
¿Se puede determinar una cota del error cometido al aproximar f por el 
polinomio en el intervalo [1, 3]?. 
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10. Determinar mediante interpolación lineal el valor de ln 1,6 si ln 1 = 0 
y In2 = 0,69315. 


11. Dados los puntos PF, = (1, 4), 2, ="0,3), Pa= (42), Pa = (7, 0), 
encontrar el polinomio interpolador de Lagrange que pase por ellos. 


12. Dada la tabla siguiente 


Tk 0al 2 R; 
f(T) -1 2 1 -2 


Determínese mediante el polinomio de interpolación de Lagrange el valor 


F(3/2). 


13. Sea h > 0 y los puntos (1_,, Zo, T1} en donde 2_¡ = To — h y 21 = 
zo +h. Si f es de clase cuatro en el intervalo [x_,, z1], pruébese que se cumple 


feo) = HE) ea AFM 190) 


14. Sea f(x) = cosx. Sabiendo que x está expresado en grados sexagesi- 
males y que 


F(15) = 0,965 93; f(17) = 0,9563; f(19) = 0,945 52 


determínese f'(17) mediante las fórmulas de derivación numérica dadas por 
las diferencias progresivas, regresivas y centrales. Establecer una cota del 
error cometido. 


15. La tabla siguiente contiene los tiempos en segundos y espacios en 
metros recorridos por un móvil. 


t O0 10 20 30 40 
s 0 325 870 1,425 2,126 


Determinar la velocidad en t = 25 y la aceleración en t = 20. 


16. Hallar las fórmulas de derivación numérica para la derivada de orden 
tres. 
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17. Calcular mediante la regla de los trapecios con n = 4 un valor apro- 
ximado de la integral 
3 
1 
"i —dx 
MET 


y señalar una cota del error cometido. 


18. Calcular mediante la regla de los trapecios con n = 4 un valor apro- 
ximado de la integral 
1 
f e”dz 
El 


a Y "A 1 
ez 0,3679 0,6065 1,0000 1,6487 2,7183 


sabiendo que 


Evaluar la cota del error cometido. Realizar el proceso con cuatro cifras 
decimales redondeadas. 
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